﻿gi-uri care combină memoria mică și rapidă cu memoria mare și lentă, ceea ce vă permite să obțineți atât memorie de mare viteză, cât și memorie de mare capacitate la un preț rezonabil O cantitate mică de memorie cu o viteză mare de funcționare se numește memorie cache (de la cuvântul francez "cacher" - "a ascunde" ; se citește "cache") În continuare, vom descrie pe scurt cum este utilizată memoria cache și cum funcționează Veți găsi o descriere mai detaliată în capitolul Ideea de bază a unui cache este simplă: conține cuvintele care sunt cele mai utilizate Dacă procesorul are nevoie de un cuvânt, mai întâi accesează memoria cache Numai dacă cuvântul nu este acolo, acesta accesează memoria principală Dacă o parte semnificativă a cuvintelor se află în cache, timpul mediu de acces este redus semnificativ Astfel, succesul sau eșecul depinde de cât de multe cuvinte sunt în cache Se știe de mult că programele nu accesează memoria la întâmplare Dacă un program are nevoie de acces la adresa A, atunci cel mai probabil va avea nevoie de acces la o adresă situată lângă A Aproape toate instrucțiunile dintr-un program normal (cu excepția instrucțiunilor de salt și a apelurilor de procedură) sunt apelate din zonele de memorie secvențială În plus, de cele mai multe ori programul petrece pe bucle atunci când un set limitat de instrucțiuni În engleză, cuvântul "cash" a primit sensul "cash (pocket) money", adică ceea ce este la îndemână Și deja din el s-a format termenul "cache", care se numește memorie super-rapidă - Notă științific ed memoria principala executat iar si iar În mod similar, atunci când manipulează matrice, este probabil ca programul să acceseze aceeași matrice de multe ori înainte de a trece la altceva Situația în care, în timpul accesărilor succesive de memorie, doar o mică zonă a acesteia este utilizată pentru o anumită perioadă de timp, se numește principiul localității Acest principiu stă la baza tuturor sistemelor de cache Ideea este că atunci când un anumit cuvânt este preluat din memorie, acesta, împreună cu cuvintele învecinate, este transferat în memoria cache, ceea ce permite următoarei solicitări să acceseze rapid următoarele cuvinte Structura generală a procesorului, a memoriei cache și a memoriei principale este ilustrată în Fig Dacă un cuvânt este citit sau scris de k ori, computerul trebuie să facă acces la memoria principală lentă și k - accesări la memoria cache rapidă Cu cât k este mai mare, cu atât performanța generală este mai mare Obosi Orez Memoria cache ar trebui să fie localizată în mod logic între procesor și memoria principală Există de fapt trei locații de cache posibile Putem face calcule și mai riguroase Fie c timpul de acces la cache, m este timpul de acces la memoria principală și h este raportul de acces la cache, care arată raportul dintre numărul de accesări la cache și numărul total al tuturor acceselor la memorie În exemplul nostru h = (k - l)/k Unii autori alocă un cache miss ratio (raport ratat) egal cu - h Astfel, putem calcula timpul mediu de acces: Timp mediu de acces = s + ( - h) t Dacă h -> , adică toate accesările se fac numai la memoria cache, atunci timpul de acces tinde spre s Pe de altă parte, dacă h -> , adică de fiecare dată când trebuie să accesați memoria principală, atunci timpul de acces tinde spre c + m: mai întâi, este necesar timpul c pentru a verifica memoria cache (în acest caz, fără succes), apoi timpul t pentru a accesa memoria principală Pe unele sisteme, accesul la memoria principală poate începe în paralel cu sonda cache, astfel încât, în cazul unei pierderi de memorie cache, ciclul de acces la memoria principală a început deja Cu toate acestea, această strategie necesită abilitatea de a opri procesul de accesare a memoriei principale în cazul unei lovituri în cache, ceea ce complică dezvoltarea unui astfel de computer Memoria principală și memoria cache sunt împărțite în blocuri de dimensiuni fixe pe baza principiului localității Blocurile dintr-un cache sunt denumite în mod obișnuit linii cache Pe o pierdere de memorie cache din memoria principală în cache Capitolul Organizarea sistemelor informatice se încarcă întreaga linie, nu doar cuvântul necesar De exemplu, dacă un șir este format din de octeți, accesarea adresei presupune încărcarea întregului șir (octeți de la la ) în memoria cache în cazul în care sunt necesare alte cuvinte din acest șir după un timp Această modalitate de accesare a memoriei este mai eficientă decât apelarea fiecărui cuvânt individual, deoarece apelarea a k cuvinte o dată este mult mai rapidă decât a apela un cuvânt de k ori Memoria cache este foarte importantă pentru procesoarele de înaltă performanță Totuși, aici apar o serie de întrebări Prima întrebare este cantitatea de memorie cache Cu cât volumul este mai mare, cu atât memoria funcționează mai bine, dar cu atât este mai scumpă A doua problemă este dimensiunea liniei cache-ului Un cache de KB poate fi împărțit în de linii de octeți, de linii de octeți și așa mai departe Vom discuta despre dispozitivul cache în detaliu în Capitolul A patra întrebare este dacă instrucțiunile și datele ar trebui păstrate împreună într-un cache partajat Cea mai ușoară modalitate este de a dezvolta un cache unificat, care va stoca atât datele, cât și comenzile În acest caz, apelurile de comandă și de date sunt echilibrate automat Cu toate acestea, tendința actuală este de a folosi un cache divizat, în care instrucțiunile sunt stocate într-un cache și datele în altul Această arhitectură este numită și arhitectura Harvard, deoarece ideea de a folosi memorie separată pentru instrucțiuni și memorie separată pentru date a fost pentru prima dată încorporată în computerul Marc III, care a fost creat de Howard Aiken la Harvard Dezvoltatorii moderni au luat această cale, deoarece arhitecturile pipeline sunt acum larg răspândite și, cu o organizare pipeline, ar trebui să fie posibilă accesarea simultană atât a comenzilor, cât și a datelor (operanzi) Un cache partajat permite accesul simultan, dar un cache partajat nu De asemenea, deoarece instrucțiunile nu se schimbă în mod normal în timpul execuției programului, conținutul cache-ului de instrucțiuni nu trebuie să fie scris înapoi în memoria principală În cele din urmă, a cincea întrebare este numărul de blocuri cache În zilele noastre, foarte des, cache-ul de primul nivel se află direct pe cipul procesorului, cache-ul de al doilea nivel nu se află pe cipul în sine, ci în pachetul procesorului, iar cache-ul de al treilea nivel este și mai departe de procesor Asamblarea modulelor de memorie și tipurile acestora De la apariția memoriei cu semiconductor până la începutul anilor , toate cipurile de memorie au fost fabricate, vândute și instalate ca cipuri individuale Aceste microcircuite au conținut de la Kbit la Mbit de informații și multe altele Primele computere personale lăsau adesea sloturi goale, astfel încât cumpărătorul să poată introduce cipuri de memorie suplimentare dacă este necesar În prezent, se utilizează o abordare diferită Un grup de cipuri (de obicei sau ) este montat pe o placă de circuit imprimat minuscul și vândut ca o singură unitate Se numește SIMM (Single Inline Memory Module - modul de memorie Memoria auxiliară DIMM (modul dublu de memorie în linie) sau DIMM (modul dublu de memorie în linie) Plăcile SIMM au un conector de margine cu de pini; rata de date pe ciclu de ceas este de de biți DIMM-urile vin de obicei cu doi conectori de margine (câte unul pe fiecare parte a plăcii) cu de pini; astfel, numărul total de contacte ajunge la , iar rata de date crește la de biți pe ciclu Schema modulului SIMM este prezentată în fig Orez Modul SIMM de MB Modulul este controlat de două microcircuite De obicei, SIMM-urile și DIMM-urile conțin cipuri de Mbit ( MB) fiecare Astfel, întregul modul deține MB de informații Multe computere oferă posibilitatea de a instala patru module; prin urmare, atunci când utilizați module de MB, cantitatea totală de memorie ajunge la GB Notebook-urile folosesc de obicei un DIMM mai mic numit SO-DIMM (Small Outline DIMM) SIMM-urile și DIMM-urile pot conține un bit de paritate sau un cod de corectare a erorilor, totuși, deoarece probabilitatea erorilor într-un modul este de aproximativ o eroare în ani, majoritatea computerelor convenționale nu folosesc scheme de detectare și corectare a erorilor Memoria auxiliară Indiferent de cantitatea de memorie principală, aceasta va fi încă mică Este natura noastră, vrem mereu să stocăm mai multe date în memoria computerului decât poate conține Odată cu dezvoltarea tehnologiei, oamenii vin în minte astfel de lucruri care anterior erau considerate complet fantastice De exemplu, s-ar putea imagina că Biblioteca Congresului a decis să digitalizeze și să vândă textul integral, cu toate ilustrațiile, al tuturor titlurilor pe care le deținea ("Toată cunoștințele umane pentru doar USD") În medie, fiecare carte conține MB de text și MB de ilustrații ambalate Astfel, pentru a găzdui de milioane de cărți, ai nevoie de IO octeți sau TB de memorie Pentru a stoca toate lungmetrajele existente ( ) aveți nevoie de aproximativ aceeași cantitate de spațiu Un astfel de volum de informații nu poate fi plasat în prezent în memoria principală și este puțin probabil să se facă în viitor (cel puțin în următoarele câteva decenii) Capitolul Organizarea sistemelor informatice Structura ierarhică a memoriei Structura ierarhică a memoriei este soluția tradițională la problema stocării unor cantități mari de date (Fig ) În vârful ierarhiei se află registrele procesorului Accesul la registre este cel mai rapid Urmează memoria cache, care acum variază de la KB la câțiva megaocteți Apoi vine memoria principală, care în prezent poate stoca de la MB la zeci de gigaocteți Apoi vin discurile magnetice și, în final, unitățile de bandă și discurile optice, care sunt folosite pentru a stoca arhive Orez Organizarea memoriei pe cinci niveluri Pe măsură ce vă deplasați de sus în jos în ierarhie, trei parametri se modifică În primul rând, timpul de acces crește Accesul la înregistrare durează câteva nanosecunde, accesul la cache puțin mai mult, accesul la memoria principală câteva zeci de nanosecunde Apoi, există un decalaj mare: accesul la disc durează cel puțin µs, iar timpul de acces pentru benzi magnetice și discuri optice poate fi măsurat în general în secunde (din moment ce aceste medii de stocare trebuie încă plasate în dispozitivul corespunzător) În al doilea rând, cantitatea de memorie crește Registrele pot conține cel mult de octeți, memorie cache - câțiva megaocteți, memoria principală - zeci de mii de megaocteți, discuri magnetice - de la câteva unități la câteva zeci de gigaocteți Benzile magnetice și discurile optice sunt stocate independent de computer, astfel încât volumul lor total este limitat doar de capacitățile financiare ale proprietarului În al treilea rând, numărul de biți pe care îi primiți pentru dolar crește Costul memoriei principale este de câțiva dolari pe megaoctet , Rețineți că costul unitar al memoriei este în scădere constantă, în timp ce volumul acesteia crește Legea lui Moore se aplică și aici Astăzi, un megabyte de memorie RAM costă aproximativ cenți - Notă științific ed Memoria auxiliară discurile magnetice câțiva cenți pe megaoctet, iar banda magnetică câțiva dolari pe gigaoctet sau mai puțin Registrele, memoria cache și memoria principală au fost deja acoperite În secțiunile următoare, vom vorbi despre discuri magnetice și apoi vom trece la studiul discurilor optice Nu vom lua în considerare unitățile de bandă, deoarece acestea sunt rar folosite; în plus, nu este practic nimic de spus despre ele Discuri magnetice Un disc magnetic este format din una sau mai multe suprafețe de aluminiu acoperite cu un strat magnetic Inițial, diametrul lor era de cm, acum - de la la cm, pentru laptopuri - mai puțin de cm, iar această valoare continuă să scadă Capul discului, care conține bobina de inducție, se deplasează pe suprafața discului, sprijinindu-se pe o pernă de aer Rețineți că capul unei dischete atinge suprafața Când un curent pozitiv sau negativ trece prin cap, acesta magnetizează suprafața de sub cap În acest caz, particulele magnetice sunt magnetizate la dreapta sau la stânga, în funcție de polaritatea curentului Când capul trece peste zona magnetizată, în ea apare un curent pozitiv sau negativ (în cap), ceea ce face posibilă citirea biților scrisi anterior Deoarece discul se rotește sub cap, fluxul de biți poate fi scris și apoi citit din Configurația pistei de disc este prezentată în fig Intervalul intersectorial Lățimea pistei - microni până la , microni Orez Fragment de pistă de disc (două sectoare) În prezent, IBM le face din sticlă - Notă științific ed Capitolul Organizarea sistemelor informatice O piesă este o secvență circulară de biți scrisă pe un disc într-o singură rotație Fiecare pistă este împărțită în sectoare de lungime fixă Fiecare sector conține de obicei octeți de date Înainte de date este un preambul (preambul), care permite capului să se sincronizeze înainte de a citi sau scrie După date vine codul de corectare a erorilor (Error-Correcting Code, ECC), care este folosit ca cod Hamming sau mai des codul Reed-Solomon, care vă permite să corectați mai multe erori, și nu doar pe unele singure Există un interval intersectorial între sectoarele adiacente Mulți producători listează dimensiunea unui disc neformatat (ca și cum fiecare piesă ar conține doar date), deși ar fi mai corect să enumerați capacitatea unui disc formatat care nu include preambule, coduri ECC și intervale intersectoriale Capacitatea unei unități formatate este de obicei cu % mai mică decât cea a unei unități neformatate Toate discurile au suporturi, se pot deplasa înainte și înapoi de-a lungul razei la distanțe diferite de axul în jurul căruia se rotește discul Diferite trasee sunt înregistrate la distanțe diferite de axă Astfel, pistele sunt o serie de cercuri concentrice dispuse în jurul fusului Lățimea pistei depinde de mărimea capului și de precizia mișcării acestuia Astăzi discurile au între și de piste pe cm, adică lățimea fiecărei piste este între și microni ( micron = = / mm) Trebuie remarcat faptul că pista nu este o depresiune pe suprafața discului, ci pur și simplu un inel de material magnetizat, care este separat de alte piste prin zone mici de graniță Densitatea de biți a pistelor concentrice diferă în funcție de distanța de la centrul discului și depinde în principal de calitatea suprafeței discului și de curățenia aerului Densitatea de înregistrare a discurilor moderne variază de la la bps Astfel, atunci când scrieți în direcția radială, există de aproximativ de ori mai multe date pe unitate de suprafață decât în direcția circumferențială Pentru a crește densitatea, producătorii dezvoltă tehnologii în care măsurarea "lungă" a biților nu se desfășoară de-a lungul circumferinței discului, ci pe verticală - pare să intre în adâncimea materialului Aceste tehnologii sunt denumite colectiv înregistrare perpendiculară, iar primele modele de discuri comerciale bazate pe aceste tehnologii vor apărea foarte curând Pentru a obține o suprafață de înaltă calitate și o puritate suficientă a aerului, discurile sunt sigilate ermetic Astfel de discuri se numesc hard disk Au fost lansate pentru prima dată de IBM Aveau MB de memorie fixă și MB de memorie amovibilă Poate că aceste discuri au fost asociate cu puștile Winchester - Majoritatea discurilor magnetice constau din mai multe platouri stivuite unul sub celălalt, așa cum se arată în Fig Fiecare suprafață este furnizată cu un suport și un cap Suporturile sunt fixate în așa fel încât să se poată deplasa simultan la distanțe diferite față de axă Un set de piste situate la aceeași distanță de centru se numește cilindru În modern pușcă cu două țevi de calibru - Notă transl Memoria auxiliară Modelele interschimbabile de drive PC sunt instalate de la până la platouri care conțin de la până la de suprafețe de lucru Suprafața Suprafața Suprafața Suprafața Suprafața Suprafața Suprafața Suprafata O Orez Winchester cu patru unități Performanța discului depinde de mulți factori Pentru a citi sau scrie un sector, capul trebuie să se deplaseze la distanța dorită față de axă Acest proces se numește căutare Timpul mediu de căutare între melodiile luate la întâmplare este de până la ms, iar căutarea între melodiile adiacente este mai mică de ms Când capul este plasat la distanța dorită de centru, acesta așteaptă ceva timp (numit timp de așteptare sector) până când sectorul dorit este sub cap Majoritatea discurilor se rotesc la , sau rpm Astfel, timpul mediu de așteptare al unui sector (jumătate de rotație) este între și ms Timpul de transfer al informațiilor depinde de densitatea de înregistrare și de viteza de rotație La rate de transfer de până la MB pe secundă , timpul de transfer per sector ( octeți) este de până la µs Prin urmare, timpul de căutare și latența sectorului determină timpul de transmitere a informațiilor Este clar că citirea sectoarelor din diferite părți ale discului este ineficientă De menționat că, din cauza prezenței preambulelor, codurilor ECC, a decalajelor dintre sectoare, precum și datorită faptului că se petrece un anumit timp căutând o pistă și așteptând un sector, există o diferență uriașă între rata de date pentru cazurile în care datele necesare sunt împrăștiate în diferite părți ale discului și când sunt în același loc și citite secvenţial Rata maximă de date în primul caz este atinsă în momentul în care capul este situat deasupra primului bit de date Cu toate acestea, această viteză de operare poate fi menținută doar într-un singur sector Pentru unele aplicații, cum ar fi multimedia, contează rata medie de biți într-o anumită perioadă, ținând cont de timpul necesar de căutare și de latența sectorului În hard disk-urile moderne, viteza de citire liniară a depășit deja MB pe secundă - Notă științific ed Capitolul Organizarea sistemelor informatice Cu puțină ingeniozitate, formula veche a școlii pentru calcularea circumferinței c = pg va dezvălui că lungimea totală a pistelor exterioare este mai mare decât lungimea celor interioare Deoarece toate discurile magnetice se rotesc cu o viteză unghiulară constantă, indiferent unde se află capetele, există o problemă evidentă În trecut, atunci când fabricau discuri, producătorii creau cea mai mare densitate de înregistrare posibilă pe pista interioară și, pe măsură ce vă îndepărtați de centrul discului, densitatea de înregistrare a scăzut treptat Dacă o pistă conține, de exemplu, sectoare, atunci fiecare dintre ele ocupă un arc de ° și nu contează pe ce cilindru se află această pistă În prezent este utilizată o strategie diferită Cilindrii sunt împărțiți în zone (de obicei de la la pe un disc) Pe măsură ce vă îndepărtați de centrul discului, numărul de sectoare pe pistă din fiecare zonă crește Acest lucru complică procedura de stocare a informațiilor pe pistă, dar crește capacitatea discului, care este considerată mai importantă Toate sectoarele au aceeași dimensiune Diagrama unui disc cu cinci zone este prezentată în Fig Un așa-numit controler este conectat la disc - un microcircuit care controlează discul Unele controlere conțin un procesor întreg Sarcinile controlerului includ recepția de comenzi precum READ, WRITE și FORMAT din software (adică scrierea tuturor preambulelor), controlul mișcării brațului, detectarea și corectarea erorilor, conversia octeților citiți din memorie într-un flux continuu de biți și viciu invers Unele controlere memorează în memoria cache mai multe sectoare pentru utilizare ulterioară și omit sectoare defecte Necesitatea acestei din urmă funcție este cauzată de prezența sectoarelor cu avarie, Memoria auxiliară adică o zonă magnetizată permanent Când controlerul detectează un sector defect, îl înlocuiește cu unul dintre sectoarele libere care sunt alocate special în acest scop în fiecare cilindru sau zonă dischete Odată cu inventarea computerului personal, a devenit necesară distribuirea software-ului într-un fel Soluția problemei a fost o dischetă, sau o dischetă, un mic mediu de stocare amovibil Dischetele au fost inventate de IBM Inițial, dischetele conțineau informații despre întreținerea mainframe-urilor (pentru angajații companiei cumpărătoare) Dar producătorii de computere au adoptat curând ideea și au început să folosească dischetele ca mediu convenabil pentru înregistrarea software-ului și vânzarea acestuia Dischetele au aceleași caracteristici generale ca și discurile pe care tocmai le-am uitat, cu singura diferență că capetele hard disk-urilor se deplasează pe suprafața discului pe o pernă de aer, în timp ce pentru dischete capetele ating suprafața Drept urmare, atât dischetele în sine, cât și capetele se uzează foarte repede Prin urmare, atunci când nu există citire și scriere a informațiilor, capetele sunt îndepărtate de la suprafață, iar computerul oprește rotația discului Acest lucru prelungește durata de viață a dischetelor Dar, în același timp, dacă se primește o comandă de citire sau scriere, există o mică întârziere (aproximativ o jumătate de secundă) înainte ca motorul să înceapă să funcționeze Dischetele au rămas în uz timp de aproximativ de ani, dar majoritatea configurațiilor moderne ale computerelor nu includ unități de dischete Unități IDE Unitățile computerelor personale moderne au evoluat de la unitatea IBM PC XT Era o unitate Seagate de MB controlată de un controler Xebec pe un card integrat Acest disc avea capete, cilindri și sectoare pe pistă Controlerul ar putea gestiona două discuri Sistemul de operare citește și scrie informații pe disc Pentru a face acest lucru, ea a transmis parametri registrelor procesorului și a numit BIOS (Basic Input Output System - sistem de bază de intrare / ieșire) situat în ROM-ul încorporat Sistemul BIOS a solicitat instrucțiuni ale mașinii pentru a încărca registrele controlerului, ceea ce a început transferul de date La început, controlerul a fost plasat pe o placă separată, iar odată cu lansarea dispozitivelor IDE (Integrated Drive Electronics - un dispozitiv cu controler integrat) la mijlocul anilor , a început să fie încorporat în placa de bază Cu toate acestea, convențiile de apelare BIOS nu s-au schimbat deoarece era necesar să se asigure compatibilitatea cu versiunile mai vechi Apel la sectoare A început să fie încorporat în hard disk-ul propriu-zis, adică în placa de circuit imprimat situată în carcasa hard diskului Placa de bază găzduiește a doua parte a controlerului pentru această interfață - Notă științific ed Capitolul Organizarea sistemelor informatice a fost produs prin numere de cap, cilindru și sector, cu capete și cilindri numerotate de la , iar sectoarele de la Probabil, această situație a apărut din cauza unei erori a unuia dintre programatorii BIOS care și-a scris capodopera în asamblatorul Având biți pentru Numărul capetelor, biți pentru un sector și biți pentru un cilindru, discul ar putea conține maximum capete, de sectoare și de cilindri, adică un total de de sectoare Capacitatea unui astfel de disc era de MB, iar la acel moment această cifră era considerată uriașă (ai acumula acum reproșuri pe o mașină nouă care nu poate gestiona discuri mai mari de PB?) În curând au apărut discuri cu o capacitate de peste MB, dar aveau o geometrie diferită ( capete, de sectoare, de cilindri) Sistemul de operare nu le-a putut accesa deoarece convențiile de apelare BIOS nu s-au schimbat (cerință de compatibilitate) Ca urmare, controlerele au început să emită informații pe baza ipotezei că geometria discului se potrivește cu cea specificată în BIOS Dar, de fapt, geometria virtuală a fost pur și simplu suprapusă pe cea reală Deși această metodă a funcționat, a îngreunat sistemele de operare să dispună datele pe disc într-un anumit mod pentru a reduce timpii de căutare În cele din urmă, unitățile IDE au fost înlocuite cu dispozitive EIDE (Extended IDE - dispozitive avansate cu controler integrat), suportând o schemă de adresare suplimentară LBA (Logical Block Addressing - adresare bloc liniară) Cu adresare liniară, sectoarele sunt pur și simplu numerotate de la la - Deși controlerul trebuie să traducă adresele LBA în adrese de cap, sector și cilindru, dimensiunea discului poate depăși MB Din păcate, însă, s-a născut o nouă limitare de x de octeți ( GB) În , când a fost adoptat standardul EIDE, nimănui nu i-a trecut prin cap că discuri cu această capacitate vor apărea ceva timp mai târziu În general, comitetele de standardizare, precum politicienii, preferă adesea să amâne rezolvarea problemelor, lăsându-le în seama succesorilor lor Unitățile și controlerele EIDE au și alte îmbunătățiri De exemplu, sunt capabili să controleze discuri (datorită a două canale, fiecare dintre acestea putând fi conectat la un disc primar și secundar), au o rată de transfer de date mai mare ( , în loc de MB / s), pot controla Unități CD-ROM și DVD Standardul EIDE s-a îmbunătățit odată cu dezvoltarea progresului tehnologic, dar cu toate acestea succesorul său a fost numit ATA- (AT Attachment), care arăta ca un indiciu la sistemele IBM PC / AT (abrevierea AT, formată din sintagma Advanced Technology - "progresiv tehnologie", în acest context, referit la procesorul progresiv pe biți tactat la MHz) Următoarea versiune a standardului, numită ATAP- (ATA Packet Interface - ATA packet interface), a fost caracterizată printr-o viteză de Mbit/s În versiunea ATARI- , a ajuns la Mbps Pe măsură ce limita de GB impusă de adresele liniare pe de biți a devenit din ce în ce mai dureroasă, standardul ATARI- a crescut dimensiunea adresei LBA la de biți Limita acestui standard este x ( PB) Dacă capacitatea discului crește cu % anual, LBA-urile pe de biți vor crește Memoria auxiliară Datele vor rămâne relevante până în aproximativ Pentru a afla cum va fi rezolvată această problemă, probabil că puteți citi edițiile din a -a a acestei cărți Evident, următorul pas este creșterea dimensiunii adresei LBA la de biți În standardul ATARI- , rata de transfer de date a fost crescută la Mbps În plus, pentru prima dată s-a acordat atenție problemei zgomotului Adevărata descoperire a fost făcută în standardul ATAI- În loc să extindă conectorul discului (și, în consecință, rata de transfer de date), a apărut o specificație pentru interfața serial ATA (Serial ATA, SATA), care a făcut posibilă transferul de informații printr-un conector cu pini la viteze de la Mbps (în timp, viteza va crește la , Gbps /Cu) Prin înlocuirea cablului plat cu de fire cu un cablu rotund de câțiva milimetri în diametru, ventilația unității de sistem s-a îmbunătățit În plus, la trimiterea semnalelor prin interfața SATA se consumă doar , V (comparativ cu V al ATARI- ), rezultând un consum total de energie mai mic Cel mai probabil, în câțiva ani, toate computerele vor fi transferate la standardul SATA Acest scenariu este susținut de faptul că problema consumului de energie devine din ce în ce mai urgentă - atât pentru centrele de date echipate cu ferme de discuri puternice, cât și pentru laptopurile cu surse de alimentare limitate [ ] discuri SCSI Unitățile SCSI sunt la fel ca unitățile IDE în ceea ce privește cilindrii, pistele și sectoarele, dar au o interfață diferită și o rată de transfer de date mai mare În , compania inventatorului dischetei, Howard Shugart, a lansat un disc cu interfața SASI (Shugart Associates System Interface) În , institutul ANCI, după lungi discuții, a transformat oarecum această interfață și și-a schimbat numele în SCSI (Small Computer System Interface - small computer system interface) Abrevierea SCSI se pronunță "tell" Versiunile cu viteză mai mare se numesc Fast SCSI ( MHz), Ultra SCSI ( MHz), Ultra SCSI ( MHz), Ultra SCSI ( MHz) și Ultra SCSI ( MHz) Fiecare dintre aceste arome avea și o versiune pe biți Principalii parametri ai tuturor acestor versiuni sunt rezumați în tabel Deoarece unitățile SCSI au o rată de transfer mare, acestea sunt utilizate în majoritatea stațiilor de lucru UNIX produse de Sun, HP, SGI și alții Aceste unități sunt, de asemenea, încorporate în computerele Macintosh și serverele de rețea Intel SCSI nu este doar o interfață pentru hard disk Acesta este un bus la care se pot conecta un controler SCSI și până la șapte dispozitive suplimentare Acestea pot fi unul sau mai multe hard disk-uri SCSI, cititoare și scriitoare CD-ROM, scanere, unități de bandă și alte periferice Fiecare dispozitiv are propriul cod de identificare de la la (până la pentru versiunile pe biți) Fiecare dispozitiv are doi conectori: unul este de intrare, celălalt este de ieșire Cablurile conectează mufa de ieșire a unui dispozitiv la mufa de intrare a următorului dispozitiv și așa mai departe Capitolul Organizarea sistemelor informatice la fel pentru conectarea becurilor într-o ghirlandă de pom de Crăciun Ultimul dispozitiv din lanț trebuie să fie un terminal, astfel încât reflexiile de la capetele magistralei să nu distorsioneze datele de pe magistrală De obicei, controlerul este plasat pe cardul încorporat și este prima verigă din lanț, deși acest lucru nu este necesar Tabelul Câteva opțiuni SCSI valide Nume Cantitate Frecvență magistrală, MHz Rată de transmisie, biți MB/s SCSI- Rapid SCSI Wide Fast SCSI Ultra SCSI Wide Ultra SCSI Ultra SCSI Wide Ultra SCSI Ultra SCSI Wide Ultra SCSI Ultra SCSI Wide Ultra SCSI Cel mai obișnuit cablu pentru un dispozitiv SCSI pe biți are de fire, dintre care (împământare) sunt asociate cu alte , oferind o bună imunitate la zgomot, care este necesară pentru funcționarea de mare viteză Din cele de fire, sunt folosite pentru date, pentru paritate, pentru control, iar restul sunt salvate pentru utilizare ulterioară Dispozitivele pe și de biți necesită cablu suplimentar pentru semnale suplimentare Lungimea cablului poate fi de câțiva metri pentru a asigura comunicarea cu dispozitivele externe (scanere etc ) Controlerele SCSI și perifericele SCSI pot fi surse de comandă sau receptori De obicei, controlerul, acționând ca o sursă, trimite comenzi către discuri și alte periferice, care la rândul lor acționează ca niște chiuvete Comenzile sunt blocuri de până la octeți care îi spun receptorului ce trebuie să facă Comenzile și răspunsurile sunt scrise ca fraze, folosind diverse semnale de control pentru a delimita fraze și pentru a rezolva conflictele care apar atunci când mai multe dispozitive încearcă să folosească magistrala în același timp Acest lucru este foarte important deoarece interfața SCSI permite tuturor dispozitivelor să funcționeze simultan, ceea ce îmbunătățește foarte mult performanța mediului, deoarece mai multe procese sunt activate simultan (UNIX sau Windows XP sunt exemple) În sistemele IDE și EIDE, dacă unul dintre dispozitive este în modul activ, restul trebuie să fie pasiv Memoria auxiliară Matrice RAID Performanța procesorului a crescut semnificativ în ultimul deceniu, aproape dublându-se la fiecare , ani Cu toate acestea, performanța discurilor este diferită În anii , timpul mediu de căutare în minicalculatoare era între și ms Acum timpul de căutare este de aproximativ ms În multe industrii tehnice (de exemplu, în industria auto sau a aviației), o creștere de sau ori a productivității în două decenii ar fi considerată uriașă, dar în industria computerelor, aceste cifre sunt uluitoare Astfel, decalajul dintre performanța procesoarelor și a discurilor a continuat să crească în tot acest timp După cum am văzut deja, pentru a crește viteza procesorului, se folosesc tehnologii paralele de procesare a datelor De mulți ani încoace, diverși oameni au venit cu ideea că ar fi bine să facem ca dispozitivele I/O să funcționeze și în paralel În , un articol [ ] propunea opțiuni diferite pentru organizarea memoriei pe disc, care puteau fi folosite pentru a îmbunătăți performanța, fiabilitatea sau ambele Aceste idei au fost imediat adoptate de producătorii de computere, ceea ce a dus la apariția unei noi clase de dispozitive I/O numite RAID Inițial, acronimul RAID a reprezentat Redundant Array of Inexpensive Disks (matrice redundantă de discuri ieftine), dar mai târziu litera I din abreviere în loc de originalul Ieftin (neexpensive) a început să însemne Independent (independent) Poate le-a dat producătorilor dreptul legal de a face discuri nerezonabil de scumpe? Matricea RAID a fost opusă discului SLED (Single Large Expensive Disk - one large expensive disk) Ideea de bază din spatele RAID este următoarea Lângă computer este instalată o cutie cu discuri (de obicei un server mare), controlerul de disc este înlocuit cu un controler RAID, datele sunt copiate în matricea RAID și apoi sunt efectuate acțiunile obișnuite Cu alte cuvinte, sistemul de operare percepe RAID ca SLED, în timp ce matricea RAID are performanțe și fiabilitate mai ridicate Deoarece unitățile SCSI oferă performanțe ridicate la un cost relativ scăzut și, deoarece un singur controler poate gestiona mai multe unități (până la șapte unități pe modelele SCSI pe biți și până la pe modele pe biți), majoritatea dispozitivelor RAID constau dintr-un sistem SCSI controller , conceput pentru a gestiona o matrice RAID și o cutie de discuri SCSI, pe care sistemul de operare le percepe ca un singur disc mare Astfel, nu sunt necesare modificări software pentru a utiliza o matrice RAID, ceea ce este foarte benefic pentru mulți administratori de sistem Sistemele RAID au mai multe avantaje În primul rând, după cum sa menționat deja, software-ul tratează matricea RAID ca pe o unitate mare În al doilea rând, datele de pe toate discurile dintr-o matrice RAID sunt împărțite pe discuri în așa fel încât să poată fi efectuate operațiuni paralele Câteva opțiuni diferite de distribuție a datelor propuse în [ ] sunt acum cunoscute ca RAID , RAID și așa mai departe până la RAID În plus, există câteva alte niveluri care Capitolul Organizarea sistemelor informatice despre care nu vom discuta Termenul "nivel" este oarecum regretabil, deoarece aici nu există o structură ierarhică Doar că există opțiuni diferite pentru organizarea discurilor O matrice RAID de nivel este prezentată în Figura , a Este un disc virtual împărțit în benzi (fâșii) de k sectoare fiecare, în timp ce sectoarele de la la k - ocupă banda , sectoarele de la k la k - ocupă banda etc Pentru k = , fiecare o bandă este un sector, pentru k = fiecare bandă este două sectoare și așa mai departe , a Aceasta se numește striping de date pe discuri Figura prezintă o matrice RAID cu patru unități De exemplu, dacă software-ul apelează o comandă pentru a citi un bloc de date care constă din patru benzi consecutive și începe la granița dintre benzi, atunci controlerul RAID împarte această comandă în comenzi separate, fiecare pentru una dintre cele patru unități, și le execută în paralel Astfel, obținem un dispozitiv I/O paralel fără a schimba software-ul Nivelul RAID funcționează cel mai bine cu cereri mari - cu cât cererea este mai mare, cu atât mai bine Dacă o interogare trebuie să utilizeze mai multe benzi decât unitățile din matricea RAID, atunci unele unități primesc solicitări multiple și, de îndată ce o astfel de unitate completează prima solicitare, trece la următoarea Sarcina controlerului este de a împărți corect cererea, de a trimite comenzile corecte pe discurile corespunzătoare în secvența corectă și apoi de a scrie corect rezultatele în memorie Performanța acestei abordări este foarte mare și nu este dificil de implementat RAID funcționează cel mai rău cu sistemele de operare care solicită periodic bucăți mici de date (un sector per acces) În acest caz, rezultatele vor fi bineînțeles corecte, dar nu va exista paralelism și, prin urmare, nici un câștig de performanță Un alt dezavantaj al acestei structuri este că este potențial mai puțin fiabilă decât SLED-ul De exemplu, luați în considerare o matrice RAID de patru unități, fiecare dintre ele poate eșua în medie la fiecare de ore Adică, eșecurile într-o astfel de matrice RAID vor avea loc aproximativ la fiecare de ore, în timp ce toate datele se pot pierde O unitate SLED se defectează, în medie, la fiecare de ore, dar, deoarece este o singură unitate, este de ori mai fiabilă Deoarece nu există redundanță în designul descris, aceasta este o matrice RAID "falsă" Următoarea variantă este matricea RAID de nivel Este prezentată în fig b și, spre deosebire de RAID , este un adevărat RAID În această structură, toate discurile sunt duplicate, deci există discuri originale și copii de rezervă De fapt real, dar nivel zero - Notă științific ed În fig b arată nivelul RAID + , nu nivelul - Notă științific ed Memoria auxiliară d e Dunga O Dunga Dunga Dunga CHO-Z Dunga Dunga Dunga Dunga ch - ; RAID nivelul Dunga Banda Grup Grup unsprezece - Dunga Dunga Dunga Dunga 'CHO-Z Dunga Dunga Dunga , - Dunga Dunga Banda - Grup Grup unsprezece RAID nivelul Grup - Grup Grup Grup - Grup Grup Grup Grup Orez Matrice RAID de la nivelul la Backup-urile și unitățile de paritate sunt incolore Capitolul Organizarea sistemelor informatice La înregistrarea informațiilor, fiecare bandă este înregistrată de două ori Oricare dintre cele două copii poate fi folosită pentru citire, iar informațiile pot fi încărcate de pe mai multe discuri în același timp decât într-o matrice RAID Prin urmare, performanța de scriere va fi aceeași ca un disc obișnuit, iar performanța de citire va fi mult mai mare (maximum de două ori) Toleranța la erori este excelentă: dacă un disc eșuează, se folosește o copie Recuperarea constă pur și simplu în instalarea unei noi unități și copierea tuturor informațiilor din backup pe aceasta Spre deosebire de nivelurile și , care operează pe benzi de sectoare, nivelul RAID operează pe cuvinte și uneori chiar pe octeți Imaginați-vă că fiecare octet al discului virtual este împărțit în două fragmente de biți, apoi la fiecare dintre ele se adaugă un cod Hamming și astfel se obține un cuvânt de biți, în care , și sunt biți de paritate Apoi imaginați-vă că cele discuri prezentate în Fig , c, sincronizate de poziția consolei și poziția de rotație Apoi, într-o singură operație, puteți scrie un cuvânt de biți cu un cod Hamming pe discuri, câte un bit pe disc O schemă similară a fost folosită în așa-numitele mașini de gândire SM- biți de paritate (cod Hamming) au fost adăugați la cuvântul de date de de biți Rezultatul a fost un cuvânt de cod de de biți, căruia i s-a adăugat un bit suplimentar de paritate, iar acest cuvânt a fost înregistrat pe de discuri Performanța generală a fost uriașă, deoarece de sectoare de date au putut fi scrise în același timp Dacă se pierdea unul dintre discuri, nici nu existau probleme, deoarece pierderea unui disc însemna pierderea a câte un bit în fiecare cuvânt de de biți, iar codul Hamming a rezolvat acest lucru instantaneu Cu toate acestea, o astfel de schemă necesită ca toate discurile să fie sincronizate prin rotație De asemenea, are sens să-l folosești doar dacă ai un număr suficient de mare de discuri (chiar și cu de discuri de date și discuri de paritate, suprasarcina este de %) În plus, controlerul are o sarcină mare, deoarece acesta trebuie să calculeze suma de control a codului Hamming atunci când transmite fiecare bit O matrice RAID de nivel este o versiune simplificată a unei matrice RAID de nivel , d Aici, pentru fiecare cuvânt de date, bit de paritate este calculat și scris pe discul de paritate Ca și în cazul unei matrice RAID de nivel , discurile trebuie să fie perfect sincronizate, deoarece fiecare cuvânt de date este răspândit pe mai multe discuri La prima vedere, poate părea că un singur bit de paritate vă permite doar să detectați, dar nu să corectați erorile Când vine vorba de erori arbitrare, această observație este adevărată Cu toate acestea, în cazul unei defecțiuni a discului, bitul de paritate oferă o corecție a erorii pe un bit, deoarece poziția bitului greșit este cunoscută Dacă apare o eroare, controlerul raportează că toți biții sunt Dacă apare o eroare de paritate într-un cuvânt, bitul de pe disc care a eșuat trebuie să fie și, prin urmare, este corectat Deși nivelurile RAID și oferă rate de transfer de date foarte mari, numărul de solicitări I/O pe secundă nu este mai mare decât cu o singură unitate Memoria auxiliară Nivelurile RAID și , la fel ca RAID-urile entry-level, funcționează cu dungi mai degrabă decât cu cuvinte de paritate și nu necesită sincronizare pe disc O matrice RAID de nivel (vezi Figura e) este organizată în același mod ca o matrice de nivel RAID , cu diferența că o matrice de nivel RAID are un disc suplimentar pe care sunt scrise benzi de paritate De exemplu, fiecare bandă este formată din k octeți Toate benzile trebuie să fie într-o relație XOR, iar banda de paritate pentru această relație trebuie să fie, de asemenea, k octeți Dacă apare o defecțiune a discului, octeții pierduți pot fi recalculați folosind informații de pe discul de paritate Această soluție previne pierderile de disc, dar reduce semnificativ performanța în cazul patch-urilor mici Dacă un sector se modifică, este necesar să citiți informațiile de pe toate discurile pentru a calcula din nou biții de paritate și a-i scrie din nou În schimb, puteți citi datele vechi și vechii biți de paritate de pe disc și puteți calcula noi biți de paritate din aceștia Dar chiar și cu această optimizare a procesului, dacă există remedieri minore, sunt necesare două citiri și două scrieri Astfel de dificultăți în încărcarea datelor pe un disc de paritate pot fi un obstacol în atingerea performanțelor înalte Această problemă este eliminată la nivelul RAID , în care biții de paritate sunt distribuiți uniform pe toate discurile și scriși într-un cerc, așa cum se arată în Figura , f Cu toate acestea, în cazul unei defecțiuni a discului, este destul de dificil să restabiliți conținutul discului pierdut, deși este posibil CD-ROM-uri Discurile optice, care au fost folosite inițial pentru înregistrarea programelor de televiziune, au devenit ulterior unul dintre principalele medii de stocare din industria calculatoarelor Datorită capacității lor ridicate și prețului scăzut, discurile optice sunt utilizate pe scară largă pentru distribuția de software, cărți, filme și alte tipuri de date și pentru copiile de arhivare ale hard discurilor Primele discuri optice au fost inventate de corporația olandeză Philips pentru a stoca filme Aveau un diametru de cm, produse sub marca LaserVision, dar nu erau populare nicăieri, cu excepția Japoniei În , Philips Corporation, împreună cu Sony, au dezvoltat discuri compacte (Compact Disc, CD), care au înlocuit rapid discurile de vinil folosite pentru înregistrarea muzicii Descrierea detaliilor tehnice ale CD-ului a fost publicată în Standardul internațional oficial (IS ), adesea denumită Cartea roșie (din culoarea coperții) Standardele internaționale sunt publicate de Organizația Internațională de Standardizare (ISO), care este un analog cu organizațiile naționale de standardizare precum ANSI, DIN etc Fiecare astfel de organizație are propriul său număr IS (Standard Internațional - standard internațional) Standardul Internațional pentru Specificațiile Discurilor a fost publicat pentru a face compatibile CD-urile de la diferiți editori de muzică și playere de la diferiți producători Toate CD-urile trebuie să aibă mm în diametru și , mm grosime, iar diametrul găurii Capitolul Organizarea sistemelor informatice în mijloc ar trebui să fie de mm CD-urile audio au fost primul mediu de stocare digital care a intrat pe piața de masă Se presupune că vor fi folosite timp de o sută de ani CD-ul este realizat folosind un laser infraroșu foarte puternic care arde găuri de , microni într-un disc special de sticlă Pe acest disc principal, se face un șablon cu proeminențe în acele locuri în care laserul a ars găuri În șablon se injectează rășină lichidă (policarbonat) și astfel se obține un CD cu același set de găuri ca într-un disc de sticlă Pe rășină se aplică un strat foarte subțire de aluminiu, care, la rândul său, este acoperită cu un lac de protecție După aceea, se aplică o etichetă Degajările din stratul inferior de rășină se numesc gropi, iar spațiile plate dintre găuri se numesc terenuri În timpul redării, o diodă laser de putere mică strălucește lumină infraroșie la o lungime de undă de , microni pe puțuri și platforme succesive Laserul este situat pe partea de rășină a discului, astfel încât găurile laser se transformă în proeminențe pe o suprafață plană Deoarece gropițele sunt un sfert din lungimea de undă a luminii laser, lungimea luminii reflectate de proeminență este jumătate din lungimea de undă a luminii reflectate de pe suprafața plană din jurul proeminenței Ca rezultat, dacă lumina este reflectată de pe proeminență, fotodetectorul jucătorului primește mai puțină lumină decât atunci când este reflectată de pe pad Acesta este modul în care placa turnantă distinge gaura de teren Deși ar părea mai simplu să folosești o gaură pentru a înregistra un zero și un pad pentru a înregistra unul, s-a dovedit a fi mai fiabil să folosești o tranziție hole-to-pad sau pad-to-hole pentru unul și nicio tranziție la un zero Puțurile și locurile sunt înregistrate în spirală Înregistrarea începe la o anumită distanță de orificiul din centrul discului și progresează spre margine, ocupând mm de disc Spirala trece prin de rotații în jurul discului (aproximativ pe mm) Dacă spirala este îndreptată, lungimea ei va fi de , km Spirala este prezentată în fig Pentru ca muzica să sune normal, găurile și terenurile trebuie să se schimbe cu o viteză liniară constantă Prin urmare, viteza de rotație a CD-ului ar trebui să scadă treptat pe măsură ce capul de citire se deplasează de la centrul discului la marginea exterioară Cu capul pe interiorul platoului, pentru a atinge viteza dorita de cm/s, viteza de rotatie trebuie sa fie de rpm Când capul se află în exteriorul platoului, viteza de rotație scade la rpm, permițând aceeași viteză liniară În acest fel, un disc compact care se rotește cu o viteză liniară constantă diferă de un disc magnetic care se rotește cu o viteză unghiulară constantă, indiferent unde se află capul în acel moment În plus, viteza de rotație a unui CD ( rpm) nu corespunde deloc cu viteza de rotație a discurilor magnetice, care variază de la la rpm În , Philips și Sony au început să folosească CD-uri pentru a stoca datele computerului Ei au publicat Cartea galbenă, care a definit standardul exact pentru ceea ce au numit CD-ROM (Compact Disc-Read Only) Memoria auxiliară Memorie - memorie numai pentru citire pe un CD) Pentru a intra pe piața CD-urilor audio dezvoltată atunci, CD-urile de computer trebuiau să aibă aceeași dimensiune ca și CD-urile audio, compatibile mecanic și optic cu acestea și produse folosind aceeași tehnologie Ca urmare a acestei decizii, au fost necesare motoare care funcționau la viteză mică și puteau schimba viteza Costul producerii unui CD a fost în medie de aproximativ USD Cartea galbenă definește formatele de date computerizate De asemenea, descrie tehnici avansate de corectare a erorilor, care este un pas semnificativ, deoarece informaticienii, spre deosebire de iubitorii de muzică, acordă o mare importanță erorilor de biți Aspectul unui CD constă în codificarea fiecărui octet cu un caracter de biți După cum sa menționat deja, biți sunt suficienți pentru a codifica un octet de biți cu un cod Hamming, lăsând doi biți în plus De fapt, se folosește un sistem de codare mai puternic Traducerea de la un sistem pe la biți pentru citirea informațiilor se face în hardware folosind tabele de căutare La nivelul următor, de caractere consecutive formează un cadru de de biți Fiecare cadru conține de biți de date ( de octeți) Restul de de biți sunt utilizați pentru corectarea și controlul erorilor Pentru CD-urile audio și pentru computer, acest sistem este același Pentru CD-urile de computer, fiecare de cadre sunt grupate într-un sector, așa cum se arată în Fig Fiecare sector începe cu un preambul de octeți, primii dintre care formează valoarea OOFFFFFFFFFFFFFFFFFFOO (hexazecimal), care permite jucătorului să determine începutul sectorului Următorii octeți conțin numărul sectorului Numărul este necesar deoarece căutarea unui CD, care are date în spirală, este mult mai dificilă decât un disc magnetic, care are date în piste concentrice Pentru a găsi un anumit sector, software-ul calculează Capitolul Organizarea sistemelor informatice află unde aproximativ trebuie să mergi; un cap de citire este plasat acolo și apoi începe o căutare a preambulului pentru a stabili cât de corectă a fost numărarea Ultimul octet al preambulului determină tipul discului Caractere de biți fiecare de caractere alcătuiesc cadru Cadre de de biți, fiecare cu de octeți Preambul de cadre alcătuiesc sector de date date ECC Tip sector ( octeți) Octetul Orez Aspect CD Cartea galbenă definește două tipuri de discuri Pe fig Figura prezintă structura datelor pentru tipul , unde preambulul este de octeți, datele sunt de de octeți și codul de corectare a erorilor este de de octeți (codul Reed-Solomon) Pe discurile de tip , datele și codurile de corectare a erorilor sunt combinate într-un câmp de date de de octeți Această schemă este utilizată pentru aplicațiile care nu trebuie să repare erori (sau, mai precis, care nu își pot lua timp pentru a face acest lucru), cum ar fi audio și video Rețineți că sunt utilizate trei scheme de corectare a erorilor pentru a asigura un grad ridicat de fiabilitate: în cadrul unui simbol, într-un cadru și într-un sector Erorile pe un singur bit sunt corectate la cel mai scăzut nivel, exploziile de erori sunt corectate la nivel de cadru și toate erorile reziduale sunt corectate la nivel de sector Pentru a menține această fiabilitate, sunt necesare de cadre de de biți ( de octeți) pentru a obține de octeți de încărcare utilă Astfel, randamentul este de doar % Unitățile CD-ROM cu o singură viteză citesc de sectoare pe secundă, ceea ce oferă o rată de transfer de date de de octeți/s pentru unitățile de tip și de octeți/s pentru unitățile de tip Unitățile cu două viteze sunt de două ori mai rapide, etc la cea mai mare viteză Un CD audio standard "deține" de minute de muzică, ceea ce corespunde unei valori de de octeți sau MB, deoarece MB = de octeți ( de octeți), nu de octeți Rețineți că nici o unitate CD-ROM de x ( octeți/s) nu este comparabilă ca performanță cu o unitate de disc magnetică SCSI- de MB/s, deși multe unități CD-ROM utilizează interfața SCSI (în plus, o interfață IDE este folosit) Din aceasta rezultă clar că CD-urile sunt semnificativ inferioare ca performanță discurilor magnetice, deși capacitatea CD-urilor este mult mai mare În , Philips Corporation a publicat Cartea Verde, adăugând elemente grafice și capacitatea de a plasa date audio, video și generale într-un singur sector, ceea ce era necesar pentru CD-urile multimedia Memoria auxiliară Ultima problemă care trebuia rezolvată în dezvoltarea CD-urilor a fost compatibilitatea sistemului de fișiere Pentru a putea folosi același CD pe computere diferite, trebuia să existe un acord privind sistemul de fișiere pentru CD-uri Pentru a emite un astfel de acord, reprezentanții diferitelor companii de calculatoare s-au întâlnit la Lake Tahoe, la granița dintre California și Nevada, și au dezvoltat un sistem de fișiere pe care l-au numit High Sierra (după numele localității în care s-au întâlnit) Acest sistem a evoluat ulterior într-un standard internațional (IS ) Există trei niveluri ale acestui standard La nivelul , sunt permise nume de fișiere de până la caractere, iar numele fișierului poate fi urmat de o extensie de până la caractere (convenția de denumire a fișierelor MS-DOS) Numele de fișiere pot conține numai litere mari, cifre și caractere de subliniere Directoarele pot fi imbricate unul în altul și nu sunt permise mai mult de nivele de ierarhie Numele de director nu poate conține o extensie La primul nivel, toate fișierele trebuie să fie învecinate, ceea ce nu este deosebit de dificil în cazul unui suport pe care informațiile sunt scrise o singură dată Orice CD care respectă standardul IS de nivel poate fi citit folosind MS-DOS, computere Apple, computere UNIX și, practic, orice altele Producătorii de CD-uri consideră această caracteristică un mare plus Nivelul al IS permite nume de fișiere cu o lungime de până la de caractere, iar nivelul permite nume de fișiere necontigue Extensiile Rock Ridge (numite după orașul din Burning Saddles al lui Mel Brooks) permit nume de fișiere foarte lungi (pentru UNIX), UID-uri și GID-uri și legături simbolice, dar CD-urile care nu sunt de nivelul nu vor fi citite pe toate computerele Discuri CD-R La început, echipamentul necesar pentru realizarea discurilor master (atât audio, cât și computer) era foarte scump Dar, așa cum se întâmplă de obicei în industria computerelor, nimic nu rămâne scump prea mult timp Până la mijlocul anilor , arzătoarele de CD-uri nu mai mari decât o placă turnantă erau obișnuite și disponibile publicului în orice magazin de hardware Aceste dispozitive erau încă diferite de discurile magnetice, deoarece informațiile scrise odată pe un CD nu mai puteau fi șterse Cu toate acestea, au găsit rapid spațiu ca medii de stocare suplimentare, iar hard disk-urile au continuat să servească drept suport principal În plus, persoane fizice și companii mici au reușit să-și producă propriile CD-uri în loturi mici sau să producă mastere și să le expedieze către marile duplicatoare comerciale Aceste discuri se numesc CD-R (CD-Recordable) Baza unui disc CD-R este un semifabricat din policarbonat de mm Aceleași spații libere sunt folosite în producția de discuri CD-ROM Cu toate acestea, discurile CD-R diferă de discurile CD-ROM prin faptul că conțin o canelură Capitolul Organizarea sistemelor informatice rina , mm, concepută pentru a direcționa laserul în timpul înregistrării Pentru a menține un feedback constant, canelura este sinusoidală cu o abatere de , mm și o frecvență de exact , kHz, astfel încât viteza de rotație să poată fi determinată cu precizie și ajustată dacă este necesar Un CD-R arată ca un disc normal, doar că nu este argintiu, ci auriu, deoarece aurul este folosit pentru a face stratul reflectorizant în loc de aluminiu Spre deosebire de CD-urile convenționale, găurile și terenurile de pe discurile CD-R sunt simulate prin modificarea reflectivității suprafeței Pentru a face acest lucru, între stratul de policarbonat și stratul de aur reflectorizant este plasat un strat de colorant (Fig ) Se folosesc două tipuri de vopsea: cianina verde și ptalocianina gălbui-portocalie Chimiștii pot argumenta la infinit care dintre ele este mai bun Acești coloranți sunt similari cu cei folosiți în fotografie, motiv pentru care Kodak și Fuji sunt principalii producători de discuri CD-R Eticheta Punctul negru de pe stratul de colorant este format prin scriere cu laser Orez Secțiune transversală a discului CD-R și a laserului (nu la scară) Un CD convențional are o structură similară, dar nu are un strat de colorant, iar în loc de un strat de aur se folosește un strat de aluminiu cu găuri În stadiul inițial, stratul de colorant este transparent, ceea ce permite luminii laser să treacă și să se reflecte în stratul de aur La înregistrarea informațiilor, puterea laserului crește la - mW Când fasciculul ajunge la colorant, colorantul se încălzește și, ca urmare, legătura chimică este ruptă Această modificare a structurii moleculare creează o pată întunecată La citire (când puterea laserului este de , mW), fotodetectorul detectează diferența dintre punctele întunecate unde colorantul a fost deteriorat și zonele transparente unde colorantul a rămas intact Când redați discul, chiar și pe o unitate CD-ROM convențională sau pe un player audio, această diferență este percepută ca diferența dintre orificiile și plăcuțele unui disc CD-ROM tradițional Memoria auxiliară Niciun nou tip de CD nu era complet fără parametrii de publicare într-o carte de o anumită culoare În cazul CD-R-ului, a fost Cartea Portocalie, lansată în Acest document descrie un disc CD-R, precum și un nou format, CD-ROM XA, care permite scrierea incrementală a informațiilor pe un CD-R (câteva sectoare astăzi, câteva sectoare mâine, câteva sectoare o lună mai târziu , etc ) Un grup de sectoare consecutive înregistrate la un moment dat se numește pistă Una dintre primele utilizări ale formatului CD-R a fost CD-ul foto Kodak La utilizarea acestei tehnologii, filmul expus și un CD foto cu poze vechi sunt introduse în procesor, care restituie CD-ul, adăugând în prealabil la acesta (după pozele vechi) imaginile din filmul expus Noul lot de date rezultat în urma scanării negativelor este scris pe un CD ca o pistă separată Această metodă de înregistrare este necesară deoarece spațiile pentru discurile CD-R sunt prea scumpe și nu este rentabilă să înregistrați fiecare bandă nouă pe un disc nou Cu toate acestea, odată cu apariția acestei tehnologii de înregistrare, a apărut o nouă problemă Înainte de lansarea Cărții Orange, la începutul tuturor CD-urilor exista un singur tabel VTOC (Cuprins Volum - cuprinsul discului), din cauza căruia era imposibil să adăugați informații pe disc Soluția problemei a fost propunerea de a atribui fiecărei piese de pe disc propriul tabel VTOC Fișierele listate în tabelul VTOC pot include toate fișierele de pe piesele anterioare sau unele dintre ele După ce un disc CD-R este introdus în cititor, sistemul de operare începe să caute printre melodii cel mai recent tabel VTOC, care reflectă starea curentă a discului Dacă tabelul VTOC listează doar câteva, și nu toate, fișierele de pe piesele existente, poate părea că fișierele au fost șterse Piesele pot fi grupate în sesiuni În acest caz, vorbim despre CD-uri cu mai multe sesiuni Playerele audio standard nu pot gestiona CD-uri cu mai multe secțiuni, deoarece încearcă să caute un singur tabel VTOC la începutul discului Fiecare piesă trebuie înregistrată continuu fără oprire Prin urmare, hard disk-ul de la care provin datele trebuie să fie suficient de rapid pentru a le livra la timp Dacă fișierele de copiat sunt localizate în diferite părți ale hard diskului, un timp lung de căutare poate duce la oprirea fluxului de date care vin pe CD-R și, în consecință, poate cauza o lipsă de date în buffer Drept urmare, veți avea un coaster minunat strălucitor (dar scump) pentru pahare și sticle Software-ul CD-R oferă de obicei o opțiune specială pentru a pre-asambla toate fișierele necesare într-un singur bloc Adică, o copie de MB a CD-ului este creată înainte ca fișierele să fie transferate pe CD-R Cu toate acestea, acest proces dublează de obicei timpul de scriere, necesită MB de spațiu liber pe disc și nu protejează unitatea de recalibrare dacă se supraîncălzi Odată cu apariția discurilor CD-R, persoanele fizice și companiile au putut să copieze cu ușurință CD-uri de computer și muzică, uneori cu încălcarea drepturilor de autor Au fost concepute diverse medii Capitolul Organizarea sistemelor informatice Măsuri de combatere a pirateriei care îngreunează citirea CD-urilor folosind software nedezvoltat de producătorul CD-ului Un astfel de mod este să utilizați informații despre câți gigaocteți este dimensiunea tuturor fișierelor de pe disc Acest lucru împiedică copierea fișierelor pe hard disk folosind software-ul convențional Dimensiunile reale ale fișierelor sunt incluse în software specializat conceput pentru a citi CD-ul sau sunt ascunse undeva pe CD (adesea sub formă criptată) Într-un alt mod, în sectoarele selectate sunt introduse coduri ECC incorecte în mod deliberat Software-ul inclus cu acest CD corectează aceste erori, iar software-ul obișnuit nu poate funcționa deoarece se știe că codurile sunt greșite În plus, este posibil să se utilizeze goluri non-standard între piste și alte "defecte" fizice Discuri CD-RW Deși oamenii sunt obișnuiți să se ocupe de medii care nu pot fi reinscriptibile (cum ar fi hârtie, film sau vinil), există încă o cerere pentru CD-uri reinscriptibile În prezent, a apărut tehnologia CD-RW (CD-ReWritable - CD rewritable), care folosește medii de aceeași dimensiune ca și pentru discurile CD-R, dar în loc de colorant (cianină sau ptalocianina) în producția de CD-RW ca înregistrarea stratul folosește un aliaj de argint, indiu, antimoniu și telur Acest aliaj are două stări: cristalin și amorf, care au reflectivitate diferită Inscriptoarele de CD sunt echipate cu un laser cu trei niveluri de putere La cea mai mare putere, laserul topește aliajul, schimbându-i starea de la cristalin cu reflexie ridicată la amorf cu reflexie redusă, rezultând o gropiță La putere medie, aliajul se topește și revine la starea sa naturală cristalină, în timp ce gaura se transformă din nou într-o platformă La putere redusă, laserul determină starea materialului (oferind citirea informațiilor), nu are loc nicio schimbare de stare Discurile CD-RW nu au înlocuit discurile CD-R, deoarece suporturile CD-RW sunt mult mai scumpe decât discurile CD-R În plus, pentru aplicațiile axate pe crearea de copii de rezervă ale hard disk-urilor, faptul că informațiile nu pot fi șterse accidental de pe un CD-R reprezintă un mare plus DVD-uri Discurile compacte din principalele formate (CD și CD-ROM) au fost folosite din De atunci, tehnologia a avansat, discurile optice de mare capacitate sunt acum destul de accesibile și la mare căutare Hollywood face o tranziție fericită de la casete video analogice la videodiscuri digitale Memoria auxiliară pentru că sunt de mai bună calitate, sunt mai ieftin de produs, durează mai mult, ocupă mai puțin spațiu pe rafturile magazinelor și nu trebuie bobinate Companiile de electrocasnice sunt încântate de un nou produs de masă și multe companii de computere sunt bucuroși să adauge multimedia la software-ul lor Această dezvoltare a tehnologiei, precum și cererea pentru produsele a trei industrii extrem de bogate și puternice, au dus la nașterea DVD-urilor Inițial, abrevierea DVD înseamnă Digital Video Disk (Digital Video Disk), acum a devenit oficial Digital Versatile Disk (Digital Versatile Disk) DVD-urile sunt similare cu CD-urile în general La fel ca CD-urile convenționale, acestea au un diametru de mm, sunt fabricate din policarbonat și conțin găuri și terenuri care sunt iluminate de o diodă laser și citite de un fotodetector Cu toate acestea, există mai multe diferențe: ♦ godeuri mai mici ( , microni în loc de , microni ca un CD obișnuit); ♦ spirală mai strânsă ( , microni între piste în loc de , microni); ♦ laser roșu (cu lungimea de undă de , microni în loc de , microni) Combinate, aceste îmbunătățiri au dus la o creștere de șapte ori a capacității (până la , GB) Cititorul DVD x funcționează la , MB/s (cititorul CD-ROM funcționează la KB/s) Din păcate, trecerea la laser roșu a necesitat playere DVD cu două lasere sau sisteme optice sofisticate pentru a citi muzică și CD-uri de computer existente Deoarece nu toate playerele DVD sunt echipate cu astfel de sisteme, nu toate pot funcționa cu CD-uri vechi În plus, nu este întotdeauna posibil să citiți discuri CD-R și CD-RW Este suficient , GB? Pot fi Folosind formatul de compresie MPEG- (standard IS ), un DVD de , GB poate stoca de minute de video pe tot ecranul de înaltă rezoluție ( x ) împreună cu audio în limbi și subtitrări în alte de limbi Aproximativ % dintre filmele realizate la Hollywood durează mai puțin de de minute Cu toate acestea, unele aplicații (cum ar fi jocurile multimedia sau publicațiile de referință) pot necesita mai mult spațiu, iar Hollywoodului nu se deranjează să pună mai multe filme pe un singur disc Ca urmare, au apărut formate DVD: Discuri cu o singură față cu un singur strat ( , GB) Discuri cu o singură față cu două straturi ( , GB) Discuri cu două fețe cu un singur strat ( , GB) Discuri cu două fețe cu două straturi ( GB) De ce atâtea formate? Pe scurt, motivul principal este politica Philips și Sony au vrut să facă discuri cu o singură față cu strat dublu, în timp ce Toshiba și Time Warner au vrut să facă discuri cu două fețe cu un singur strat Philips și Sony au crezut că cumpărătorii nu ar vrea Capitolul Organizarea sistemelor informatice flip discs, iar Time Warner credea că dacă puneți două straturi pe aceeași parte a unui disc, nu ar funcționa O soluție de compromis este să satisfacă toate dorințele, iar piața însăși va determina care dintre opțiuni va supraviețui Cu tehnologia cu două straturi, un strat semi-reflectorizant este plasat pe stratul reflectorizant inferior În funcție de locul în care este focalizat laserul, acesta este reflectat fie dintr-un strat, fie dintr-un altul Pentru a asigura citirea fiabilă a informațiilor, puțurile și zonele stratului inferior sunt făcute puțin mai mari ca dimensiune, astfel încât capacitatea sa este puțin mai mică decât cea a celui superior Discurile cu două fețe sunt create prin lipirea a două discuri cu o singură față de , mm grosime fiecare Pentru a păstra toate versiunile la aceeași grosime, un disc cu o singură față de , mm grosime este lipit de un suport alb (poate că în viitor acest suport va conține de minute de reclamă, în speranța că cumpărătorii vor fi interesați de ceea ce este pe el) Structura unui disc cu două fețe cu strat dublu este prezentată în fig Disc cu o singură față de , mm grosime Disc cu o singură față de , mm grosime Strat semi-reflectorizant Suport din policarbonat Suport din policarbonat Orez DVD cu două fețe dublu strat Reflector din aluminiu Reflector din aluminiu Strat semi-reflectorizant DVD-ul a fost dezvoltat de o corporație formată din companii de electrocasnice (șapte dintre ele japoneze) în strânsă cooperare cu marile studiouri de la Hollywood (unele dintre acestea fiind deținute de companii japoneze) Nici computerele, nici industria telecomunicațiilor nu au fost implicate în dezvoltare și, ca urmare, s-a pus accentul pe utilizarea DVD-urilor pentru a închiria și vinde filme Iată câteva dintre caracteristicile DVD standard: capacitatea de a exclude scene obscene din film (astfel încât părinții să poată transforma un film precum NC într-un film pe care copiii îl pot viziona), sunet pe șase canale, opțiuni de scalare largă Această ultimă caracteristică permite player-ului DVD să decidă cum să decupeze marginile din dreapta și din stânga ale cadrului imaginii unor astfel de filme, care au un raport lățime-înălțime de : , astfel încât să poată fi redate fără a compromite calitatea pe cele moderne Ecrane TV (raport lățime-înălțime de : ) O altă caracteristică care probabil nu ar fi trecut niciodată prin cap creatorilor tehnologiei informatice este incompatibilitatea deliberată a standardelor de disc pentru Statele Unite, pentru țările europene, pentru țările din alte țări NC - filme care conțin scene de sex și violență și nu sunt destinate vizionarii în familie - Notă transl Intrare ieșire continente Hollywood a introdus acest sistem deoarece filmele noi sunt întotdeauna lansate mai întâi în Statele Unite și numai după lansarea VHS sunt trimise în Europa Acest lucru este pentru a împiedica magazinele video europene să cumpere prea devreme videoclipuri în America (ceea ce ar putea reduce vânzările de filme noi în Europa) Probabil, dacă Hollywood ar fi în fruntea industriei computerelor, în America, dischetele ar avea o dimensiune de , inci, iar în Europa - cm Discuri Blu-ray Nimic nu durează pentru totdeauna în domeniul computerelor, în special tehnologia de stocare De îndată ce a apărut standardul DVD, a găsit imediat un concurent serios Succesorul DVD-ului poate fi considerat tehnologia Blu-Ray, care folosește un laser albastru în loc de unul roșu Laserul albastru are o lungime de undă mai scurtă, ceea ce înseamnă o precizie mai mare; datorită acestei circumstanțe, vă permite să reduceți dimensiunea găurilor și a zonelor Discurile Blu-Ray cu o singură față conțin aproximativ GB de date; pe două fețe - GB Rata de transfer de date este de , Mbps, ceea ce este foarte bun pentru discurile optice, deși este încă incomparabil cu cele magnetice (reamintim, standardul ATARI- prevede transferul de date la o viteză de Mbps, iar Ultra SCSI vă permite să creșteți viteza la Mbps) Discurile Blu-ray sunt de așteptat să înlocuiască în cele din urmă atât CD-urile, cât și DVD-urile, dar acest lucru va dura cu siguranță ani de zile Intrare ieșire După cum sa menționat la începutul acestui capitol, un sistem informatic constă din trei componente principale: unitatea centrală de procesare, memoria (primară și auxiliară) și dispozitivele de intrare/ieșire (imprimante, scanere și modemuri) Până acum, ne-am uitat la CPU și memorie Acum vom vorbi despre dispozitivele I/O și despre modul în care acestea se conectează la restul sistemului Cauciucuri Majoritatea calculatoarelor personale și stațiilor de lucru au o structură fizică similară cu cea prezentată în Fig De obicei, dispozitivul este o carcasă metalică cu un circuit integrat mare în partea de jos, care se numește placa de bază (de dragul corectitudinii politice, o puteți numi placa de bază) Placa de bază conține un cip de procesor, mai multe sloturi DIMM și diverse cipuri de suport Există, de asemenea, un bus pe placa de bază (se întinde de-a lungul plăcii) și mai mulți conectori pentru conectarea dispozitivelor I/O Uneori există două magistrale: una (bus PCI), cu o rată mare de transfer de date, este destinată dispozitivelor I/O moderne, iar cealaltă (bus ISA), cu o rată scăzută de transfer de date Capitolul Organizarea sistemelor informatice transfer de date, pentru dispozitivele vechi În computerele moderne, magistrala ISA, de regulă, este absentă Orez Structura fizică a unui computer personal Structura logică a unui computer personal convențional este ilustrată în Fig Acest computer are o magistrală pentru conectarea procesorului, a memoriei și a dispozitivelor I/O; cu toate acestea, majoritatea sistemelor au două sau mai multe autobuze Monitorizați Tastatură Unitatea CD ROM Controler cu tastatură Controler CD-ROM HDD Obosi Orez Structura logică a unui computer personal convențional Fiecare dispozitiv I/O este format din două părți: una care deține majoritatea componentelor electronice și se numește controler, iar cealaltă este dispozitivul I/O în sine, cum ar fi o unitate de disc Controlerul este de obicei amplasat pe placă, care este introdusă într-un slot liber Excepție fac controlerele dispozitivelor care sunt părți integrante ale computerului (de exemplu, tastaturi), care sunt uneori situate pe placa de bază Deși afișajul (monitorul) nu poate fi numit un dispozitiv suplimentar, controlerul corespunzător este uneori amplasat pe placa încorporată, astfel încât utilizatorul să poată alege plăci cu grafică după bunul plac Intrare ieșire acceleratoare fizice sau fără acestea, instalați memorie suplimentară etc Controlerul comunică cu dispozitivul însuși printr-un cablu care se conectează la conectorul de pe spatele carcasei Controlerul își gestionează dispozitivul I/O și pentru a face acest lucru reglează accesul la magistrală De exemplu, dacă un program solicită date de pe un disc, acesta trimite o comandă controlerului de disc, care apoi trimite o comandă de căutare și alte comenzi pe disc După ce a găsit pista și sectorul adecvat, discul începe să transmită date către controler sub forma unui flux de biți Sarcina controlerului este să spargă fluxul de biți în fragmente și să scrie fiecare astfel de fragment pe măsură ce biții se acumulează pentru el în memorie Un singur fragment este de obicei unul sau mai multe cuvinte Dacă controlerul citește datele din memorie sau le scrie în memorie fără participarea procesorului central, atunci ei spun că se realizează acces direct la memorie (Acces direct la memorie, DMA) Când transferul de date se termină, controlerul provoacă o întrerupere, forțând CPU să suspende programul curent și să înceapă să execute o anumită rutină Această procedură se numește handler de întrerupere și este necesară pentru a verifica erorile, dacă există, luați măsurile necesare și informați sistemul de operare că procesul I/O s-a încheiat Când handler-ul de întrerupere se termină, procesorul reia programul care a fost suspendat în momentul întreruperii Bus-ul este folosit nu numai de controlerele I/O, ci și de procesor pentru transmiterea comenzilor și a datelor Dar ce se întâmplă dacă procesorul și controlerul I/O doresc să acceseze magistrala în același timp? În acest caz, un cip special numit arbitrul de autobuz decide al cui este primul rând De obicei, dispozitivele I/O sunt preferate deoarece discurile și alte dispozitive în mișcare nu pot fi întrerupte, deoarece acest lucru poate duce la pierderea datelor Când nu rulează niciun dispozitiv I/O, CPU poate prelua controlul deplin al magistralei pentru a interacționa cu memoria Cu toate acestea, dacă orice dispozitiv I/O rulează, acesta va solicita și va primi acces la magistrală de fiecare dată când are nevoie de el Acest proces care încetinește computerul se numește furt în ciclu Structura descrisă a fost utilizată cu succes în primele computere personale, deoarece toate componentele lor au funcționat aproximativ la aceeași viteză Cu toate acestea, odată ce procesoarele, memoria și dispozitivele I/O au devenit mai rapide, a apărut o problemă: magistrala nu a putut face față sarcinii În cazul sistemelor închise, cum ar fi stațiile de lucru de inginerie, soluția a fost dezvoltarea unei noi magistrale cu o rată de date mai mare pentru următorul model de mașină Deoarece nimeni nu a migrat vreodată dispozitivele I/O de la modelul vechi la cel nou, această abordare a funcționat bine Cu toate acestea, în lumea computerelor personale, majoritatea utilizatorilor, înlocuindu-și computerul cu un model nou, nu se așteaptă să renunțe simultan la vechiul și familiarul lor imprimanta, scanerul și modemul Cu exceptia Capitolul Organizarea sistemelor informatice În plus, exista o întreagă industrie care producea o gamă largă de dispozitive I/O pentru computerele IBM PC, iar producătorii acestor dispozitive nu erau deloc interesați să înceapă toată dezvoltarea lor de la zero IBM a trecut prin această cale dificilă, lansând linia PS / după linia IBM PC Calculatoarele PS/ aveau o nouă magistrală cu o rată de transfer mai mare, dar majoritatea producătorilor de clone au continuat să folosească vechea magistrală PC, numită acum magistrala Industry Standard Architecture (ISA) Majoritatea producătorilor de discuri și I/O au continuat să producă și controlere pentru modelul vechi, așa că IBM s-a trezit într-o situație foarte neplăcută, deoarece la acea vreme era singurul producător de calculatoare personale care nu erau compatibile cu linia IBM Într-un final, compania a fost nevoită să revină la producția de calculatoare bazate pe magistrala ISA Rețineți că abrevierea ISA poate fi descifrată și ca Instruction Set Architecture (arhitectura setului de instrucțiuni), când vine vorba de nivelurile ierarhiei de instrucțiuni Deși influența pieței a dus la faptul că nu s-au făcut modificări la anvelopa veche, aceasta nu a funcționat mai repede și trebuia făcut ceva Drept urmare, alte companii au început să producă calculatoare cu mai multe magistrale, dintre care una era fie vechea magistrală ISA, fie o magistrală EISA (Extended ISA - Extended Standard Industrial Architecture), precum ISA, compatibilă cu dispozitivele I/O mai vechi În ceea ce privește cealaltă magistrală, în prezent cel mai popular model este magistrala PCI (Peripheral Component Interconnect), dezvoltată de Intel, care a decis să deschidă toate informațiile tehnice legate de magistrală pentru ca producătorii terți (inclusiv concurenții companiei) să poată dezvolta dispozitive adecvate Există multe configurații diferite de magistrală PCI Cel mai tipic dintre ele este prezentat în Fig În această configurație, CPU comunică cu controlerul de memorie printr-o conexiune dedicată de mare viteză Astfel, controlerul este conectat direct la memorie, adică transferul de date între CPU și memorie nu are loc prin magistrala PCI Cu toate acestea, perifericele de mare viteză, cum ar fi unitățile SCSI, pot fi conectate direct la magistrala PCI În plus, magistrala PCI are o conexiune paralelă la magistrala ISA, astfel încât controlerele ISA și dispozitivele aferente pot fi utilizate Acest tip de mașină conține de obicei sau sloturi PCI goale și alte sau sloturi ISA goale, astfel încât clienții să poată introduce atât carduri ISA I/O vechi (pentru dispozitive cu viteză redusă) cât și carduri PCI noi (pentru dispozitive cu viteză mare ) În prezent, există multe dispozitive de intrare-ieșire diferite Vom atinge doar cele mai comune dintre ele Trebuie remarcat faptul că magistrala ISA nu mai este menționată în standardele actuale de calculator - Notă științific ed Intrare ieșire Orez Computer personal modern cu magistrale PCI si ISA Modemul și placa de sunet sunt dispozitive ISA, controlerul SCSI este un dispozitiv PCI Terminale Terminalele computerului constau din două părți: tastatura și monitorul În mainframe, aceste părți sunt combinate într-un singur dispozitiv și sunt conectate la mainframe în sine printr-un fir obișnuit sau telefonic În companiile aeriene, bănci și diverse industrii mainframe, aceste dispozitive sunt încă utilizate pe scară largă astăzi În lumea PC-urilor, tastatura și monitorul sunt dispozitive independente, dar tastatura și monitorul mainframe-ului sunt tehnologic aceleași cu dispozitivele PC corespunzătoare Tastaturi Există mai multe tipuri de tastaturi Primele PC-uri IBM aveau un comutator sub fiecare tastă care dădea un feedback tangibil și făcea clic atunci când tasta era apăsată Astăzi, cele mai ieftine tastaturi, atunci când apăsați tastele, are loc doar contactul mecanic cu placa de circuit imprimat Tastaturile mai bune au un strat de material elastic (un tip special de cauciuc) între taste și placa de circuit Sub fiecare tastă este o cupolă mică care se îndoaie atunci când o tastă este apăsată Materialul conductor din interiorul domului completează circuitul Unele tastaturi au un magnet sub fiecare tastă, care, atunci când tasta este apăsată, trece printr-o bobină și determină astfel un curent electric Se folosesc alte metode, atât mecanice, cât și electromagnetice În computerele personale, atunci când o tastă este apăsată, are loc o procedură de întrerupere și este lansat programul de gestionare a întreruperilor (acest program face parte din software-ul sistemului de operare) Managerul de întrerupere citește conținutul unui registru hardware în controler Capitolul Organizarea sistemelor informatice tastatură pentru a obține numărul tastei apăsate (de la la ) Când cheia este eliberată, are loc o a doua întrerupere De exemplu, dacă utilizatorul apasă tasta Shift, apoi apasă și eliberează tasta M și apoi eliberează tasta Shift, sistemul de operare înțelege că dorește o literă M majusculă, nu M minusculă Gestionarea Shift, Ctrl și Alt apăsările de taste în combinație cu alte taste se efectuează numai programatic (aceasta include și binecunoscuta combinație de taste Ctrl + Alt + Del, care este folosită pentru a reporni toate computerele IBM PC și clonele acestora) Monitoare CRT Monitorul este o carcasă care conține un tub catodic (CRT) și sursele sale de alimentare Tubul cu raze catodice conține un tun de electroni care aruncă un flux de electroni pe un ecran, care este acoperit cu un strat luminiscent din interiorul părții frontale a tubului, așa cum se arată în Fig , a (Monitoarele color conțin trei tunuri de electroni: unul pentru roșu, unul pentru verde și unul pentru albastru ) În scanarea orizontală, fasciculul de electroni (fascicul) trece pe ecran în aproximativ de microsecunde, formând o linie aproape orizontală pe ecran Fasciculul face apoi o retragere orizontală spre marginea stângă pentru a începe construirea următoarei linii de scanare Un dispozitiv care, linie cu linie, creează o imagine se numește scaner raster deformare verticală Scanare orizontală Scanare verticală Retur orizontal Orez Secțiunea transversală a unui tub cu raze catodice (a); diagrama de măturare a tubului catodic (b) Măturarea orizontală este controlată de o tensiune de rampă aplicată plăcilor de deviere orizontale situate în stânga și în dreapta pistolului cu electroni Măturarea verticală este controlată de o tensiune în creștere mai lentă aplicată plăcilor verticale de deviere situate deasupra și sub tunul de electroni După un anumit număr de cicluri de măturare (de la la ), tensiunea de pe plăcile de deviere verticale și orizontale scade, iar fasciculul revine în colțul din stânga sus al ecranului Restaurarea izolatiilor complete Intrare ieșire fermentarea se realizează de până la de ori pe secundă Mișcările fasciculului sunt prezentate în fig b Deși am descris funcționarea tuburilor catodice, care folosesc câmpuri electrice pentru a mătura fasciculul de pe ecran, multe modele (în special monitoare scumpe) folosesc câmpuri magnetice în loc de cele electrice Pentru a obține o imagine pe ecran din puncte, în interiorul tubului catodic este amplasată o grilă Când o tensiune pozitivă este aplicată rețelei, electronii sunt excitați, fasciculul este îndreptat către ecran, care după un timp începe să strălucească Când se folosește o tensiune negativă, electronii sunt respinși și nu trec prin rețea, iar ecranul nu luminează Astfel, tensiunea care acționează asupra rețelei face ca setul corespunzător de biți să apară pe ecran Acest mecanism permite ca semnalul electric binar să fie tradus într-un afișaj format din puncte luminoase și întunecate Monitoare LCD Tuburile cu raze catodice sunt prea voluminoase și grele pentru a fi folosite în computerele laptop, așa că este necesară o tehnologie complet diferită pentru ecranele laptopurilor Aici, afișajele cu cristale lichide sunt cel mai des folosite Tehnologia implicată este extrem de complexă, are implementări multiple și se schimbă rapid, dar vom încerca să o păstrăm cât mai scurtă și simplă Cristalele lichide sunt molecule organice vâscoase care se mișcă ca moleculele lichide, dar au o structură asemănătoare cristalului Au fost descoperite de botanistul austriac Reinitzer în și au fost folosite pentru prima dată la fabricarea diferitelor afișaje (pentru calculatoare, ceasuri etc ) în Când moleculele sunt aranjate într-o singură linie, calitățile optice ale cristalului depind de direcția și polarizarea luminii incidente Când se folosește un câmp electric, linia de molecule și, prin urmare, proprietățile optice, se modifică Dacă cristalul lichid este expus unui fascicul de lumină, intensitatea luminii emise de cristalul lichid însuși poate fi controlată de electricitate Această proprietate este utilizată la crearea afișajelor de indicator Ecranul de afișare cu cristale lichide este format din două plăci de sticlă paralele, între care se află un spațiu etanș cu un cristal lichid Electrozii transparenți sunt conectați la ambele plăci Lumina artificială sau naturală din spatele plăcii din spate luminează ecranul din interior Electrozii conectați la plăci sunt utilizați pentru a crea câmpuri electrice în cristalul lichid Diferite părți ale ecranului sunt afectate de tensiuni diferite, ceea ce vă permite să construiți o imagine Polaroidurile sunt lipite pe partea din față și din spate a ecranului, deoarece tehnologia de afișare necesită lumină polarizată Structura generală este prezentată în fig , a Monitoarele moderne cu raze catodice pot actualiza imaginea de pe ecran la o frecvență de până la sau mai multe ori pe secundă Această valoare, desigur, este invers proporțională cu numărul de linii din care este construită imaginea - Notă științific ed Capitolul Organizarea sistemelor informatice Orez Structura ecranului pe cristale lichide (a); caneluri pe plăcile din față și din spate, situate perpendicular una pe cealaltă (b) În prezent sunt utilizate diferite tipuri de afișaje cu cristale lichide, dar vom lua în considerare doar unul dintre ele - un afișaj nematic răsucit (TN) Acest afișaj are mici caneluri orizontale pe placa din spate și mici caneluri verticale pe placa frontală, așa cum se arată în Fig b În absența unui câmp electric, moleculele sunt direcționate către aceste șanțuri Deoarece ele (canelurile) sunt perpendiculare unele pe altele, moleculele de cristale lichide sunt răsucite cu ° Pe spatele ecranului este un polaroid orizontal Transmite doar lumină polarizată orizontal Pe placa frontală a afișajului este un polaroid vertical Transmite doar lumină polarizată vertical Dacă nu ar exista cristale lichide între plăci, lumina polarizată orizontal transmisă de polaroid de pe placa din spate ar fi blocată de polaroid de pe placa frontală, făcând ecranul complet negru Cu toate acestea, structura cristalină răsucită a moleculelor prin care trece lumina schimbă planul de polarizare al luminii În absența unui câmp electric, întregul ecran cu cristale lichide strălucește Dacă se aplică tensiune anumitor părți ale plăcii, structura răsucită este distrusă, blocând trecerea luminii în aceste părți Două abordări sunt utilizate în mod obișnuit pentru aplicarea tensiunii Într-un indicator ieftin de matrice pasivă, firele sunt paralele între ele pe ambii electrozi De exemplu, într-un afișaj de x , electrodul plăcii din spate conține de fire verticale, în timp ce electrodul plăcii frontale conține Intrare ieșire de fire orizontale Dacă aplicați tensiune unuia dintre firele verticale și apoi trimiteți impulsuri către unul dintre firele orizontale, puteți modifica tensiunea la o anumită poziție a pixelului și astfel întunecați punctul dorit Dacă repetați același lucru cu următorul pixel și așa mai departe, puteți obține o linie de scanare întunecată, similară liniilor din tuburile catodice De obicei, imaginea de pe ecran este redesenată de de ori pe secundă pentru a da impresia unei imagini permanente (la fel ca în tuburile cu raze catodice) A doua abordare este utilizarea unui indicator de matrice activă Costă mult mai mult decât unul pasiv, dar oferă o calitate mai bună a imaginii, ceea ce este un mare avantaj În loc de două seturi de fire perpendiculare, matricea de puncte activă are un mic comutator pe unul dintre electrozi la fiecare poziție de pixel Schimbând starea comutatoarelor, puteți crea o combinație arbitrară de tensiuni pe ecran, în funcție de combinația de biți Aceste comutatoare se numesc tranzistori cu film subțire (TFT), iar ecranele plate care le folosesc sunt numite afișaje TFT Marea majoritate a laptopurilor și monitoarelor LCD de sine stătătoare se bazează acum pe tehnologia TFT Până acum, am descris cum funcționează monitoarele monocrome Când vine vorba de monitoare color, este suficient să spunem că acestea funcționează pe aceleași principii generale ca și monitoarele monocrome, dar detaliile sunt mult mai complexe Filtrele optice sunt folosite la fiecare poziție de pixel pentru a separa albul în roșu, verde și albastru, astfel încât aceste culori pot fi afișate independent Din combinarea acestor trei culori primare se poate obține orice culoare memorie video Imaginea de pe ecranele monitoarelor CRT și TFT este actualizată de până la de ori pe secundă; pentru aceasta se folosește memoria video situată pe placa de control al afișajului Memoria video conține unul sau mai multe bitmap reprezentând imaginea afișată pe ecran Dacă, să zicem, pe ecran se potrivesc elemente de imagine x (pixeli), atunci există valori de x în memoria video, câte una pentru fiecare pixel Pentru a trece rapid de la o imagine la alta, mai multe astfel de carduri pot fi plasate în memorie În afișajele moderne, fiecare pixel este reprezentat de o valoare RGB de octeți care determină intensitatea componentelor roșu (roșu), verde (verde) și albastru (albastru) ale imaginii După cum știți, orice culoare poate fi reprezentată printr-o suprapunere liniară a celor trei culori de bază menționate Dacă memoria video stochează informații de aproximativ x pixeli, iar fiecăruia îi sunt alocați octeți, cantitatea totală a acestor date este de aproximativ , MB; prin urmare, orice manipulare a unei astfel de imagini necesită destul de mult timp CPU Din acest motiv, unele computere folosesc numere de biți pentru a defini culorile Acest număr reprezintă Capitolul Organizarea sistemelor informatice este un index al unui tabel hardware (numit paletă de culori) cu de valori RGB ( de biți) Această soluție, cunoscută sub numele de culoare indexată, reduce cantitatea de date stocate în memoria video cu / În același timp, atunci când se aplică o culoare indexată, mai mult de de culori nu pot fi afișate pe ecran în orice moment De regulă, se formează un bitmap individual pentru fiecare fereastră, ceea ce înseamnă că, dacă există o paletă hardware, doar una dintre toate ferestrele prezente pe ecran este redată corect Pentru a scoate imagini raster (adică formate pe baza de hărți de bit) imagini necesită multă lățime de bandă De exemplu, pentru a reda un cadru de date multimedia color în format full-screen pe un afișaj de x , trebuie copiați , MB în memoria video Având în vedere că un film complet este scos la de cadre pe secundă, rata totală de biți ar trebui să fie de , MB/s Chiar și versiunea originală a magistralei PCI ( , MB/s), ca să nu mai vorbim de magistralele ISA și EISA, nu poate oferi un astfel de debit Desigur, cu cât imaginea este mai mică, cu atât rata de transfer de date necesară este mai mică, dar acest lucru nu elimină problema Pentru a crește viteza de transfer de date de la CPU la memoria video, Intel a implementat suport pentru magistrala dedicată AGP (Accelerated Graphics Port) în linia de procesoare Pentium II, care permite transferul de de biți pe ceas la o frecvență de MHz, care corespunde unei viteze de MB/Cu În versiunile ulterioare de procesoare pentru magistrala AGP, sunt acceptate viteze de x, x și x - ca urmare, sistemul face față transferului de grafice "grele" fără a încărca magistrala PCI principală Șoareci Timpul trece, iar cei care îl înțeleg din ce în ce mai puțin se așează la computer Calculatoarele din seria ENIAC au fost folosite doar de cei care le-au proiectat În anii , doar programatori cu înaltă calificare lucrau cu computerele Astăzi, mulți dintre cei care lucrează cu computere nu știu (și nu vor să știe) nici cum funcționează un computer, nici cum este programat Cu mulți ani în urmă, majoritatea computerelor aveau o interfață de linie de comandă în care erau tastate diverse comenzi Deoarece mulți nespecialiști considerau astfel de interfețe neprietenoase sau chiar ostile, companiile de calculatoare au dezvoltat interfețe speciale cu capacitatea de a indica o anumită poziție pe ecran folosind un dispozitiv special (ca în Macintosh și Windows), care este cel mai adesea un mouse Un mouse este un dispozitiv într-o carcasă mică de plastic care se așează pe o masă lângă o tastatură Dacă mutați mouse-ul pe masă, indicatorul de pe ecran se va mișca și el, ceea ce face posibilă îndreptarea acestuia către unul sau altul element al ecranului Mouse-ul are unul, două sau trei butoane care permit utilizatorilor să selecteze elementele de meniu atunci când sunt apăsate Au existat multe dezbateri despre câte butoane ar trebui să aibă un mouse Pentru utilizatorii începători, un buton a fost suficient (în acest caz este imposibil să se confunde butoanele), dar Intrare ieșire omologii lor mai experimentați au preferat mai multe butoane pentru a permite acțiuni complexe să fie efectuate pe ecran Există trei tipuri de șoareci: mecanici, optici și optomecanici La șoarecii de primul tip, roțile de cauciuc sunt situate dedesubt, ale căror axe sunt perpendiculare între ele Dacă mouse-ul se mișcă într-o direcție verticală, atunci o roată se rotește, iar dacă este în direcție orizontală, atunci alta Fiecare roată acţionează un rezistor (potenţiometru) Dacă măsurați modificarea rezistenței, puteți afla cât de departe s-a întors roata și, astfel, puteți calcula cât de departe s-a deplasat mouse-ul în fiecare direcție În ultimii ani, astfel de șoareci au fost aproape complet înlocuiți de un nou model, care folosește o minge care iese ușor de jos în loc de roți (Fig ) Orez Folosind mouse-ul pentru a selecta un element de meniu Următorul tip este mouse-ul optic Nu are nici roți, nici minge În schimb, un LED și un fotodetector sunt situate în partea de jos a mouse-ului Un mouse optic se deplasează pe suprafața unui tampon special din plastic care conține o rețea dreptunghiulară cu linii care sunt apropiate unele de altele Pe măsură ce mouse-ul se deplasează pe grilă, fotodetectorul detectează intersecțiile liniilor modificând cantitatea de lumină reflectată de LED Un dispozitiv electronic din interiorul mouse-ului numără numărul de linii traversate în fiecare direcție Al treilea tip este mouse-ul optomecanic Ea, ca un mouse mecanic mai modern, are o minge care rotește două roți situate perpendicular una pe cealaltă Roțile sunt asociate cu encodere Fiecare encoder are sloturi prin care trece lumina Când mouse-ul este mișcat, roțile se rotesc și impulsurile luminoase acționează asupra detectorilor Capitolul Organizarea sistemelor informatice de fiecare dată când apare un slot între LED și detector Numărul de impulsuri primite de detector este proporțional cu distanța Deși șoarecii pot fi instalați în mai multe moduri, o schemă comună este trimiterea unei secvențe de octeți către computer de fiecare dată când mouse-ul se mișcă la o anumită distanță minimă ( , inci, de exemplu) De obicei, aceste caracteristici sunt transmise într-un flux de biți serial Primul octet conține un număr întreg care indică cât de departe s-a deplasat mouse-ul în direcția x de la ultima dată Al doilea octet conține aceleași informații pentru direcția y Al treilea octet indică starea curentă a butoanelor mouse-ului Uneori se folosesc octeți pentru fiecare coordonată Software-ul preia aceste informații pe măsură ce intră și convertește mișcările relative ale mouse-ului într-o poziție absolută Apoi afișează o săgeată pe ecran în poziția corespunzătoare poziției mouse-ului Dacă indicați o săgeată către un anumit element de ecran și faceți clic pe butonul mouse-ului, computerul își poate da seama ce element de pe ecran este selectat Imprimante Uneori, un utilizator trebuie să imprime un document creat sau o pagină obținută de pe Internet, astfel încât computerele pot fi echipate cu o imprimantă În această secțiune, vom descrie unele dintre cele mai comune tipuri de imprimante monocrome (adică alb-negru) și color Imprimante monocrome Cele mai ieftine sunt imprimantele cu matrice de puncte, în care capul de imprimare trece secvenţial pe fiecare linie de imprimare Capul conține de la la de ace excitate de un câmp electromagnetic Imprimantele matriciale ieftine au ace pentru a imprima, să zicem de caractere pe linie într-o matrice de x Drept urmare, linia este formată din linii orizontale și fiecare dintre aceste linii este formată din x = de puncte Fiecare punct se poate imprima sau nu, în funcție de cum ar trebui să fie litera Pe fig și arată litera "A" tipărită într-o matrice de x Calitatea imprimării poate fi îmbunătățită în două moduri: prin utilizarea mai multor ace sau prin implementarea suprapunerii punctelor Pe fig Figura b prezintă litera "A" imprimată cu de ace, rezultând suprapunerea punctelor Această suprapunere necesită, de obicei, mai multe treceri pe aceeași linie de imprimare, astfel încât cu cât calitatea imprimării este mai mare, cu atât imprimanta este mai lentă Majoritatea imprimantelor pot fi configurate pentru a realiza diverse combinații de calitate și viteză Imprimantele matriceale sunt ieftine (mai ales în ceea ce privește consumabilele) și foarte fiabile, dar sunt lente, zgomotoase, iar calitatea imprimării este foarte slabă Cu toate acestea, ele sunt răspândite în cel puțin trei zone În primul rând, sunt foarte populare pentru imprimarea pe coli mari (mai mult de cm) În al doilea rând, sunt foarte convenabile de utilizat atunci când se imprimă pe bucăți mici de hârtie (de exemplu, cecuri de casierie, notificări de retragere de pe carduri de credit) Intrare ieșire card, cartele de îmbarcare ale companiei aeriene) În al treilea rând, sunt potrivite pentru imprimarea mai multor coli în același timp cu hârtie carbon introdusă între ele, iar această tehnologie este cea mai ieftină Orez Litera "A" într-o matrice x (a); litera "A" imprimată cu de ace - există o suprapunere de puncte (b) Este convenabil să utilizați acasă imprimante cu jet de cerneală ieftine Într-o astfel de imprimantă, capul de imprimare mobil conține un cartuş de cerneală Se deplasează orizontal peste hârtie în timp ce cerneala este aruncată din duzele mici Volumul unei porții de cerneală este aproximativ egal cu un picolitru Pentru claritate, clarificăm că într-o picătură de apă pot încăpea aproximativ de milioane de astfel de porții Imprimantele cu jet de cerneală sunt de două tipuri: piezoelectrice (produse de Epson) și termice (produse de Canon, HP și Lexmark) În imprimantele piezoelectrice cu jet de cerneală, lângă camera de cerneală este instalat un cristal special Când se aplică tensiune acestui cristal, acesta este deformat, ca urmare, cerneala este eliberată din duză Cu cât tensiunea este mai mare, cu atât este mai mare porțiunea de cerneală de ieșire, iar acest proces este controlat de software În imprimantele cu jet de cerneală termică (bule), este instalat un mic rezistor în fiecare duză Când se aplică tensiune, rezistorul se încălzește rapid, aduce temperatura cernelii la punctul de fierbere, ca urmare, acestea din urmă se transformă în bule de gaz Deoarece volumul bulei este mai mare decât volumul de cerneală pură, se creează o presiune crescută în duză, sub influența căreia cerneala este pulverizată pe hârtie Apoi duza se răcește și, ca urmare a scăderii presiunii în interiorul duzei, o nouă porțiune de cerneală îi este furnizată din cartuș Viteza imprimantei în această schemă este limitată de intervalul de timp al ciclului de fierbere / răcire Dimensiunea tuturor picăturilor de cerneală formate este aceeași și, de regulă, este inferioară celei a imprimantelor piezoelectrice Imprimantele cu jet de cerneală au de obicei rezoluții cuprinse între dpi (puncte pe inch) și dpi Sunt destul de ieftine și silențioase, dar au viteze de imprimare mici și excepționale Capitolul Organizarea sistemelor informatice cartușe scumpe Calitatea imprimării este bună - dacă imprimați o fotografie de înaltă rezoluție pe modelul de top al oricărei linii de imprimante cu jet de cerneală, rezultatul va fi imposibil de distins de o fotografie obișnuită de x Probabil cea mai uimitoare invenție în tehnologia tipăririi de la Johann Gutenberg, care a inventat literele mobile în secolul al XV-lea, este imprimanta laser Acest dispozitiv combină calitatea bună a imprimării, versatilitatea, viteza mare și costul moderat Imprimantele laser folosesc aproape aceeași tehnologie ca și fotocopiatoarele Multe companii produc dispozitive care combină proprietățile unui copiator, imprimante și, uneori, un fax Schematic dispozitivul imprimantei este prezentat în fig Partea principală a acestei imprimante este un tambur rotativ (unele sisteme mai scumpe folosesc panglică în loc de tambur) Înainte ca fiecare coală să fie imprimată, tamburul primește o tensiune de aproximativ V și este înconjurat de un material fotosensibil Lumina laser se deplasează de-a lungul tamburului (în lungime), la fel ca un fascicul de electroni într-un tub cu raze catodice, doar că în loc de tensiune, o oglindă octogonală rotativă este folosită pentru a scana tamburul Fasciculul de lumină este modulat, rezultând un set de zone întunecate și luminoase Zonele lovite de fascicul își pierd sarcina electrică rotind foaie alba Ramă de coli imprimate Orez Cum funcționează o imprimantă laser După ce este trasată o linie de puncte, tamburul se rotește ușor pentru a crea următoarea linie Ca urmare, prima linie de puncte ajunge în rezervor cu toner (pulbere neagră electrostatică) Tonerul este atras de punctele încărcate și astfel se formează imaginea vizuală a liniei După un timp, tamburul de toner apasă pe hârtie, lăsând o amprentă a imaginii pe ea Foaia trece apoi prin role încălzite și imagine Intrare ieșire e reparat După aceea, tamburul este descărcat și tonerul rămas este curățat de acesta După aceea, este gata să imprime următoarea pagină Inutil să spun că acest proces este o combinație extrem de complexă de tehnici care necesită cunoștințe de fizică, chimie, mecanică și optică Electronica imprimantelor laser consta dintr-un procesor rapid și câțiva megaocteți de memorie pentru a stoca imaginea completă bitmap și diverse fonturi, unele încorporate și altele încărcate din memorie Majoritatea imprimantelor primesc comenzi care descriu pagina de tipărit (spre deosebire de imprimantele care primesc imagini bitmap de la CPU) Aceste comenzi sunt de obicei date în PCL HP sau PostScript Adobe Imprimantele laser cu o rezoluție de dpi și mai mare pot imprima fotografii alb-negru, dar tehnologia este mult mai complexă decât ar părea la prima vedere Luați în considerare o fotografie scanată la dpi care trebuie tipărită pe o imprimantă cu aceeași rezoluție ( dpi) Imaginea scanată conține x pixeli pe inch, fiecare pixel având o scară de gri specifică de la (alb) la (negru) Imprimanta poate imprima la dpi, dar fiecare pixel imprimat poate fi fie negru (când există toner), fie alb (când nu există toner) Tonuri de gri nu pot fi imprimate La imprimarea unor astfel de imagini, are loc așa-numita procesare semiton (ca la tipărirea posterelor în serie) Imaginea este împărțită în celule, fiecare de x pixeli Fiecare celulă poate conține de la la de pixeli negri Pentru ochiul uman, o celulă cu mai mulți pixeli negri pare mai întunecată decât o celulă cu mai puțini pixeli negri Tonurile de gri de la la sunt transmise după cum urmează Acest interval este împărțit în de zone Cenușii de la la sunt în zona , de la la sunt în zona și așa mai departe (zona este puțin mai mică decât celelalte, deoarece nu este divizibil cu ) Când tonurile zonei se întâlnesc, celula rămâne albă, așa cum se arată în Fig a Tonurile din zona sunt reprezentate de un pixel negru per celulă Tonuri Zona - doi pixeli pe celulă, așa cum se arată în fig b Imaginile de tonuri de gri ale altor zone sunt prezentate în fig , , in-e Dacă o fotografie este scanată la dpi, rezoluția imaginii imprimate este redusă la dpi după procesarea semitonurilor Această valoare se numește gradație de semiton și se măsoară în Ірі (linii pe inch - linii pe inch) Orez Imaginea semitonurilor gri din diferite zone: - (a); - (b); - (a); - (d); - (e); - (e) Capitolul Organizarea sistemelor informatice Imprimante color Imaginile color pot fi construite în două moduri: absorbția luminii și reflectarea luminii Absorbția luminii are loc, de exemplu, atunci când se creează imagini în monitoare cu raze catodice În acest caz, imaginea este construită prin suprapunerea a trei culori primare: roșu, verde și albastru Lumina reflectată este folosită pentru a crea fotografii color și imagini în reviste lucioase În acest caz, lumina cu o anumită lungime de undă este absorbită, iar restul luminii este reflectată Astfel de imagini sunt create prin suprapunerea substractive a trei culori primare: cyan (roșul este complet absorbit), galben (albastrul este complet absorbit) și magenta (verdele este complet absorbit) Teoretic, amestecând cerneala cyan, galbenă și magenta, puteți obține orice culoare Dar în practică este foarte dificil să obții o astfel de cerneală care să absoarbă complet toată lumina și, ca urmare, să dea o culoare neagră Din acest motiv, aproape toate imprimantele color folosesc patru culori de cerneală: cyan (Cyap), galben (galben), liliac (Magenta) și negru (NacK) Acest model de culoare se numește CYMK (ultima literă este luată din cuvântul "Yask" pentru a-l deosebi de cuvântul "Yne" din modelul RGB) Monitoarele, pe de altă parte, folosesc lumina absorbită și o suprapunere de roșu, verde și albastru pentru a crea o imagine color Setul complet de culori pe care le poate produce un monitor sau o imprimantă se numește diagramă de culori Nu există un astfel de dispozitiv care să transmită complet culorile lumii din jurul nostru În cel mai bun caz, dispozitivul oferă doar de grade de intensitate a fiecărei culori, iar în final se obțin doar de culori diferite Imperfecțiunea tehnologiei reduce și mai mult acest număr, iar culorile rămase nu oferă spectrul complet de culori În plus, percepția culorii este asociată nu numai cu proprietățile fizice ale luminii, ci și cu activitatea "tijelor" și "conurilor" din retină Din toate acestea rezultă că este foarte dificil să transformi o imagine color frumoasă, care arată grozav pe ecran, într-o imagine imprimată identică Printre principalele probleme se numără următoarele: + monitoarele color folosesc lumina absorbita; imprimante color - reflectate; ♦ tubul catodic oferă de nuanțe pentru fiecare culoare, imprimantele color trebuie să poată procesa semitonuri; + monitoarele au un fundal întunecat; hârtie - ușoară; ♦ Modelele de culoare RGB și CYMK sunt diferite unele de altele Pentru ca imaginile tipărite color să se potrivească cu realitatea (sau cel puțin cu imaginile de pe ecran), sunt necesare calibrarea echipamentelor, software sofisticat și competența utilizatorului Pentru imprimarea color sunt utilizate cinci tehnologii, toate fiind bazate pe modelul color CYMK Cele mai ieftine sunt imprimantele cu jet de cerneală color Ele funcționează la fel ca imprimantele cu jet de cerneală monocrome, dar în loc de un cartuș au patru (pentru cerneală cyan, galbenă, magenta și neagră) Imprimă bine grafica color, imprimă fotografii tolerabil Intrare ieșire decantor și nu sunt foarte scumpe (rețineți că, deși imprimantele în sine sunt ieftine, cartușele sunt destul de scumpe) Pentru rezultate optime, trebuie utilizate cerneală specială și hârtie specială Există două tipuri de cerneală Cernelurile pe bază de coloranți constau din coloranți dizolvați într-un mediu lichid Acestea oferă culori strălucitoare și ies cu ușurință din cartus Principalul dezavantaj al unor astfel de cerneluri este că se estompează rapid sub influența razelor ultraviolete, care se găsesc în lumina soarelui Cernelurile pe bază de pigment conțin particule solide de pigment scufundate într-un lichid Lichidul se evaporă din hârtie, dar pigmentul rămâne Cerneala nu se estompează, dar nu produce culori la fel de strălucitoare precum cernelurile pe bază de colorant În plus, particulele de pigment înfunda adesea orificiile de evacuare ale cartuşelor, astfel încât acestea trebuie curățate periodic Fotografiile necesită hârtie cretată sau lucioasă Aceste tipuri speciale de hârtie sunt special concepute pentru a reține picăturile de cerneală și pentru a preveni sângerarea acestora Următorul tip de imprimante sunt imprimantele cu cerneală solidă Aceste imprimante conțin blocuri solide de cerneală specială de ceară, care sunt apoi topite, ceea ce necesită minute (timpul necesar pentru ca cerneala să se topească) înainte de a începe imprimarea Cerneala fierbinte este pulverizată pe hârtie, unde se solidifică și se întărește după trecerea foii între două role Al treilea tip de imprimante color sunt imprimantele laser color Funcționează la fel ca omologii lor monocromi, doar că produc patru imagini separate (cian, galben, magenta și negru) și folosesc patru toneruri diferite Deoarece o imagine bitmap completă este de obicei pre-compusă, o imagine de x dpi pe o foaie de de inci pătrați necesită milioane de pixeli Deoarece fiecare pixel este format din biți, imprimanta are nevoie de MB de memorie doar pentru a stoca imaginea sub formă de biți, fără a lua în calcul memoria necesară procesoarelor interne, fonturilor etc Această cerință face ca imprimantele laser color să fie foarte scumpe, dar acestea funcționează foarte repede și oferă o imprimare de înaltă calitate În plus, imaginile rezultate sunt stocate pentru o perioadă lungă de timp Al patrulea tip de imprimante sunt imprimantele cu cerneală de ceară Acestea conțin o bandă largă de ceară în patru culori, care este împărțită în secțiuni de dimensiunea unei foi de hârtie Mii de elemente de încălzire topesc ceara pe măsură ce hârtia trece pe sub panglică Ceara este fixată pe hârtie sub formă de pixeli în conformitate cu modelul de culoare CYMK Aceste imprimante au fost cândva foarte populare, dar acum au fost înlocuite de alte tipuri de imprimante cu consumabile mai ieftine Al cincilea tip de imprimante se bazează pe tehnologia de sublimare Acest cuvânt evocă unele note freudiene , totuși, în știință, sublimarea este înțeleasă ca Sublimarea în psihologie înseamnă procesul mental de transformare și comutare a energiei pulsiunilor în scopul activității sociale și al creativității culturale; termenul a fost introdus de Freud - Notă transl Capitolul Organizarea sistemelor informatice trecerea solidelor la starea gazoasă ocolind stadiul lichid Un astfel de material este, de exemplu, gheața carbonică (dioxid de carbon înghețat) Într-o imprimantă de sublimare, un recipient de coloranți CYMK se deplasează peste un cap de imprimare termică care conține mii de elemente de încălzire programabile Coloranții se evaporă instantaneu și sunt absorbiți de hârtie specială Fiecare element de încălzire poate produce de temperaturi diferite Cu cât temperatura este mai mare, cu atât se depune mai mult colorant și culoarea este mai intensă Spre deosebire de toate celelalte imprimante color, această imprimantă este capabilă să reproducă culorile într-un spectru aproape continuu, deci nu este necesară procesarea semitonurilor Procesul de sublimare este adesea folosit la fabricarea așa-numitelor instantanee pe hârtie specială scumpă Echipamente de telecomunicații Majoritatea calculatoarelor moderne sunt conectate la rețele de calculatoare, dintre care Internetul este cel mai răspândit Pentru a accesa acest tip de rețele este nevoie de echipamente speciale Această secțiune discută cum funcționează astfel de echipamente Modemuri Odată cu creșterea numărului de computere în ultimii ani, a devenit necesară legarea lor între ele De exemplu, vă puteți conecta computerul de acasă la computerul de la serviciu, furnizorul de servicii de internet sau sistemul bancar O linie telefonică este adesea folosită pentru a asigura o astfel de comunicare Cu toate acestea, o linie telefonică obișnuită (precum și un cablu) este prost potrivită pentru transmiterea semnalelor computerului, în care corespunde de obicei la o tensiune zero și la o tensiune de până la volți (Fig , a) Semnalele de nivel dublu în timpul transmisiei printr-o linie telefonică destinată transmisiei vocale sunt supuse unor distorsiuni severe care conduc la erori de transmisie Cu toate acestea, un semnal sinusoidal cu o frecvență de până la Hz, numit purtător, poate fi transmis cu o distorsiune relativ mică, iar această proprietate este utilizată în transmisia de date în majoritatea sistemelor de telecomunicații Deoarece forma unei undă sinusoidală este complet previzibilă, nu conține nicio informație Cu toate acestea, prin schimbarea amplitudinii, frecvenței sau fazei, este posibilă transmiterea unei secvențe de zerouri și unu, așa cum se arată în Fig Acest proces se numește modulare Cu modulația de amplitudine, se folosesc niveluri de tensiune pentru și, respectiv, (Fig , b) Dacă datele digitale sunt transmise la o rată foarte scăzută, atunci se aude un zgomot puternic la o transmisie de și niciun zgomot la o transmisie de Cu modularea în frecvență, nivelul tensiunii nu se modifică, dar frecvențele semnalului purtător pentru și sunt diferite (Fig , c) În acest caz, la transmiterea datelor digitale, pot fi auzite două tonuri: unul dintre ele corespunde cu , iar celălalt cu Modulația de frecvență este uneori numită frecvență shift keying Intrare ieșire ÎN A b V G Ora -►- B i Înalt | i amplitudine i Frecventa inalta | Scăzut i amplitudinea frecventa joasa Orez Transmiterea în serie a unui număr binar printr-o linie telefonică: semnal cu două niveluri (a); modularea amplitudinii (b); modulația de frecvență (a); modulare de fază (a) Cu modularea de fază simplă, amplitudinea și frecvența sunt menținute la același nivel, iar faza semnalului purtător se modifică cu ° când datele se schimbă de la la sau de la la (Fig , d) În sistemele de modulație de fază mai complexe, la începutul fiecărei secțiuni de timp indivizibile, faza semnalului purtător este deplasată brusc cu , , sau ° pentru a transmite biți pe interval de timp Aceasta se numește codificare de fază dibit De exemplu, o schimbare de fază de ° reprezintă , ° reprezintă și așa mai departe Există sisteme pentru transmiterea a trei sau mai mulți biți într-o secțiune de timp Numărul de astfel de intervale de timp (adică numărul de modificări potențiale ale semnalului pe secundă) se numește baud rate Când transmiteți doi sau mai mulți biți într-o singură secțiune de timp, rata de biți va depăși rata de transmisie Rețineți că termenii "baud" și "bit" sunt adesea confundați în acest context Dacă datele constau dintr-o secvență de caractere de biți, ar fi de dorit să existe un mijloc de comunicare care să transmită câte biți odată, adică perechi de fire Deoarece liniile telefonice proiectate pentru transmisia vocală oferă un singur canal de comunicație, biții trebuie trimiși succesiv unul după altul (sau în grupuri de câte doi dacă se folosește codarea dibit) Un dispozitiv care primește caractere de la un computer sub formă de semnale cu două niveluri (câte un bit) și transmite biți unul sau doi sub formă de modulație în amplitudine, fază sau frecvență se numește modem Pentru a indica începutul și sfârșitul fiecărui caracter Capitolul Organizarea sistemelor informatice la începutul și sfârșitul șirului de biți, se setează biții de început și de sfârșit, deci se obține un total de biți Modemul trimite biți individuali ai fiecărui caracter la intervale regulate De exemplu, baud înseamnă că semnalul se schimbă la fiecare microsecunde Al doilea modem care primește informația convertește semnalul purtător modulat într-un număr binar Biții ajung la modem la intervale regulate Dacă modemul întâlnește începutul unui caracter, ceasul acestuia îi spune când să înceapă să citească biții primiti Modemurile moderne transmit date la viteze cuprinse între bps și bps, ceea ce corespunde în mod obișnuit unei rate mai mici de transmisie Ele combină diferite tehnologii pentru a transmite mai mulți biți pe baud prin modularea amplitudinii, frecvenței și fazei Aproape toate modemurile moderne sunt duplex, adică pot transmite informații în ambele direcții în același timp folosind frecvențe diferite Modemurile și liniile de comunicație care nu pot transmite informații în ambele direcții în același timp (precum o cale ferată cu o singură cale) sunt numite semi-duplex Liniile de comunicație care pot transmite informații într-o singură direcție se numesc simplex Linii digitale de abonat După ce au atins odată bara de kbps, inginerii companiei de telefonie cu un sentiment de realizare s-au odihnit pe lauri Între timp, furnizorii de servicii de televiziune prin cablu au început să ofere abonaților conexiuni la internet prin cabluri partajate la viteze de până la Mbps Furnizorii de servicii prin satelit au mers și mai departe, oferind conectivitate la viteze de peste Mbps Cu cât serviciile de acces la Internet au devenit mai importante pentru companiile de telefonie, cu atât au realizat că, pentru a rămâne competitive, trebuie să ofere pieței un fel de serviciu superior decât o conexiune convențională dial-up Ca urmare a acestor reflecții, a luat naștere un nou serviciu digital de acces la Internet Serviciile care oferă mai multă lățime de bandă decât o conexiune dial-up standard sunt uneori denumite bandă largă, dar sincer, acesta este mai mult un termen de marketing decât un termen tehnic de fond Inițial, au fost propuse mai multe tehnologii de acces sub denumirea generală xDSL (Digital Subscriber Line - digital subscriber line) cu valoare x variabilă În continuare, vom discuta despre cele mai comune dintre ele - ADSL (Asymmetric DSL - asymmetric digital subscriber line) Lucrările la ADSL sunt încă în desfășurare și nu toate standardele pentru această tehnologie au fost notate, așa că unele detalii pot fi ajustate în timp Cu toate acestea, imaginea de ansamblu este probabil să rămână neschimbată Pentru mai multe informații despre ADSL, vă rugăm să consultați literatura suplimentară [ , ] De ce modemurile obișnuite sunt atât de lente? Da, pentru că inițial telefoanele au fost concepute pentru a transmite vocea și tocmai cu acest scop a fost creat întregul sistem de comunicații telefonice Transmiterea datelor prin organism Intrare ieșire prea puțină atenție s-a acordat firelor de fundal Capacitatea firului (cunoscut și ca canal de abonat) care leagă abonații cu o centrală telefonică automată (ATS) era în mod tradițional limitată de un filtru special Debitul real al unui canal de abonat depinde în mare măsură de lungimea acestuia, dar cel mai adesea (dacă lungimea nu depășește câțiva kilometri) ajunge la , MHz Cea mai comună schemă de furnizare a serviciilor ADSL este prezentată în Fig Conținutul său se reduce la îndepărtarea filtrului și la separarea spectrului eliberat de , MHz în de canale autonome, fiecare la , Hz Canalul este dedicat datelor vocale Canalele - nu sunt utilizate, eliminând astfel interferența reciprocă a semnalelor de voce și date Din restul de de canale, două sunt alocate pentru transmiterea pe legătura ascendentă și descendentă a semnalelor de control Alte canale transmit datele utilizatorului Astfel, un modem ADSL este echivalent cu de modemuri obișnuite de canale la kHz Vocea ascendentă Downdraft curgere Orez Funcționarea ADSL În principiu, un flux de date duplex poate fi trimis prin fiecare dintre canalele rămase, totuși, armonicile auxiliare, diafonia și alte efecte fizice nu permit aducerea implementării efective a tehnologiei la un nivel teoretic Este la latitudinea furnizorului de servicii să decidă cât de mult să împartă canalele în aval și în amonte Este posibil din punct de vedere tehnic să existe o distribuție egală a acestor canale, dar în majoritatea cazurilor - % este alocată organizării din aval (de obicei, de canale sunt alocate în amonte, iar restul în aval), deoarece majoritatea utilizatorilor primesc mult mai multe date decât trimit Acesta este motivul pentru care tehnologia ADSL are atât de mult succes Calitatea transmisiei datelor pe fiecare canal este monitorizată constant și, dacă este necesar, corectată; Prin urmare, vitezele canalelor pot diferi Datele sunt transmise la până la biți/baud printr-o combinație de modulație de amplitudine și fază Dacă, de exemplu, de canale în aval sunt disponibile pentru transmisia de date, iar rata de semnalizare este de baud la bps, debitul total în aval este de , Mbps În practică, raportul semnal-zgomot nu permite abordarea acestui nivel, dar cu o distanță mică de furnizorul de servicii și o calitate ridicată a canalului, o viteză de - Mbps este destul de realizabilă O configurație tipică a echipamentului ADSL este prezentată în Figura Conform acestei scheme, o rețea inter- Capitolul Organizarea sistemelor informatice dispozitiv facial (Dispozitiv de interfață de rețea, NID) Această cutie mică de plastic simbolizează granița dintre proprietatea utilizatorului și proprietatea companiei de telefonie Lângă NID (și uneori în același caz cu acest dispozitiv) este instalat un splitter (splitter) - un filtru analogic care separă datele și semnalele la o frecvență de - Hz folosit pentru transmisia vocală Fluxul de date este trimis către modemul ADSL, iar semnalele vocale sunt trimise către telefon Modemul ADSL este un procesor de semnal digital care emulează funcționarea în paralel a de modemuri convenționale la frecvențe diferite Deoarece majoritatea modemurilor ADSL sunt produse extern, conexiunea lor la computer trebuie să fie suficient de rapidă De obicei, această cerință este îndeplinită prin instalarea unei plăci Ethernet în computer și stabilirea unei conexiuni Ethernet cu două legături la modemul ADSL (Ethernet este un standard comun și foarte accesibil de rețea locală ) Uneori, un modem ADSL este conectat la un computer printr-un port USB Pe viitor, ar trebui să ne așteptăm la apariția unor plăci speciale pentru conectarea la un modem ADSL Linie telefonica Orez Configurație standard a echipamentelor ADSL Pe partea opusă a canalului de abonat, este instalat un alt splitter, care separă semnalele vocale și le redirecționează către o centrală telefonică obișnuită Semnalele de peste kHz sunt transmise la un Multiplexor de acces la linia de abonat digital (DSLAM) După ce semnalele digitale sunt convertite într-un flux de biți, pachetele sunt formate și apoi trimise furnizorului de servicii Intrare ieșire Internet prin cablu Multe companii de televiziune oferă utilizatorilor posibilitatea de a accesa Internetul prin intermediul rețelelor de cablu Această tehnologie este oarecum diferită de ADSL, așa că ar trebui luată în considerare separat În posesia fiecărui operator de televiziune prin cablu, pe lângă biroul central, există un număr de noduri principale (săli cu echipamente electronice) dispersate în tot orașul Toate sunt conectate la sediul central prin cablu de bandă largă sau fibră optică Unul sau mai multe cabluri se extind de la fiecare nod principal la consumatorii finali Pentru ca un astfel de cablu să fie conectat, acesta trebuie să fie amplasat în apropierea incintei în care se află utilizatorii În același timp, sute de utilizatori sunt conectați la același cablu De regulă, lățimea de bandă a unui astfel de cablu este de aproximativ MHz După cum puteți vedea, diferența conceptuală dintre accesul prin cablu și tehnologia ADSL este absența unui canal individual conectat la biroul furnizorului de servicii Cu toate acestea, în practică, beneficiile de a avea propriul canal cu o lățime de bandă de , MHz, pe de o parte, și un canal comun cu încă patru sute de utilizatori cu o lățime de bandă totală de MHz, pe de altă parte, sunt aproximativ echivalente (acesta se explică prin faptul că în fiecare moment individual nu mai mult de jumătate din de utilizatori sunt online) Mai mult, în toiul nopții, internetul prin cablu funcționează mult mai rapid decât în timpul zilei, în timp ce rata de transfer de date pe canalul ADSL este aceeași pe tot parcursul zilei Logica este aceasta: pentru a obține un acces optim la Internet prin intermediul unui canal de cablu, trebuie să locuiți fie într-o zonă foarte bogată (unde casele sunt la o distanță mare una de cealaltă și, prin urmare, nu atât de mulți utilizatori sunt conectați la același cablu), sau într-o zonă foarte săracă (de unde nimeni nu își permite să achiziționeze un astfel de serviciu) Deoarece mai mulți utilizatori sunt conectați la un cablu, problema reală este reglarea timpului și a frecvenței consumului de lățime de bandă Pentru a înțelege cum se rezolvă această problemă, va trebui să faceți o scurtă digresiune în tehnologia televiziunii prin cablu În SUA, intervalul de frecvență - MHz este alocat pentru difuzarea canalelor prin cablu (cu toate acestea, intervalul - MHz, destinat posturilor de radio FM, este exclus din acesta) Fiecare canal ocupă MHz (inclusiv benzi de gardă pentru a preveni interferența între canalele adiacente) În Europa, pragul inferior al gamei de cablu este de MHz, iar canalele ocupă fiecare câte - MHz (din această cauză se asigură rezoluție crescută conform standardelor PAL / SECAM); în toate celelalte privințe, schema de distribuție a frecvenței este similară cu cea americană În ambele cazuri, partea inferioară a intervalului nu este utilizată pentru transmiterea semnalelor de televiziune Încercând să implementeze tehnologia de acces la Internet prin cablu, operatorii s-au confruntat cu două probleme: Cum să preveniți interferențele atunci când transmiteți date și semnal TV în același timp? Cum se organizează traficul bidirecțional cu amplificatoare unidirecționale? Capitolul Organizarea sistemelor informatice Soluțiile alese sunt următoarele Cablurile moderne funcționează la o frecvență mult peste MHz, ajungând la MHz sau mai mult Canalele de uplink (adică direcționate de la utilizator la headend) ocupă un interval de - MHz (în Europa este puțin mai mare), în timp ce frecvențele înalte sunt folosite pentru a transmite traficul în aval (de la headend către utilizator) (Fig ) ) o/ I și MHz SI shr si TV Frecvențele downlink f n o; Ha eu f & Orez Alocarea frecvenței într-un sistem standard de televiziune prin cablu cu acces la Internet Vă rugăm să rețineți că, deoarece semnalele TV sunt transmise exclusiv în direcția în aval, amplificatoarele în amonte pot funcționa numai în intervalul - MHz, iar amplificatoarele în aval în intervalul de MHz și mai mare Astfel, debitul celor două direcții este asimetric, deoarece intervalul din amonte este mult mai mic decât cel din aval Cu toate acestea, această împrejurare nu deranjează prea mult operatorii de cablu, întrucât traficul este transmis în mare parte utilizatorului, și nu de la acesta Până la urmă, companiile de televiziune au avut succes și în furnizarea de servicii DSL cu acces asimetric, deși nu există restricții tehnice privind traficul în amonte Modemurile prin cablu sunt folosite pentru a conecta utilizatorul final la Internet Acestea sunt dispozitive cu două interfețe - pentru conectarea la un computer, pe de o parte, și la o rețea de cablu, pe de altă parte Interfața computer-cablu-modem este simplă - ca și în cazul ADSL, o rețea Ethernet miniaturală este organizată pentru transmiterea datelor În viitor, modemurile prin cablu vor fi realizate cel mai probabil ca plăci instalate în unitatea de sistem, așa cum sa întâmplat cu modemurile interne V x Pe partea opusă, sunt instalate echipamente mai sofisticate Standardele de cablare sunt un subiect din domeniul ingineriei radio și, prin urmare, luarea în detaliu a acestuia în contextul nostru pare inadecvată Singurul lucru care merită remarcat este funcționarea continuă a modemurilor prin cablu - în acest sens seamănă cu modemurile ADSL Conexiunea este stabilită și menținută în mod constant și este întreruptă numai atunci când alimentarea cu energie electrică este oprită - acest lucru se datorează faptului că operatorii de rețele de cablu nu percep o taxă de timp pentru serviciile lor Intrare ieșire Luați în considerare succesiunea operațiunilor care apar la conectarea și pornirea modemului În primul rând, modemul scanează conținutul legăturilor în jos pentru un pachet special care este trimis la intervale regulate de la headend și care conține parametrii de sistem pentru modemurile recent conectate După ce a găsit unul, modemul își anunță prezența într-unul dintre uplink-uri Headend-ul atribuie apoi legături în sus și în jos specifice modemului Ulterior, dacă headend-ul consideră că este necesar să echilibreze sarcina, alte canale pot fi alocate modemului Modemul determină apoi distanța până la headend, trimițându-i un pachet special și calculând timpul de răspuns Acest proces se numește calibrare (ranging) Cunoscând distanța până la headend, modemul poate ajusta uplink-urile în consecință Faptul este că fluxul de date din amonte este împărțit în intervale de timp sau mini-sloturi Fiecare pachet din amonte trebuie să se încadreze într-unul sau mai multe mini-sloturi consecutive Headend-ul trimite în mod regulat notificări despre începutul noilor cicluri de minislot, dar deoarece modemurile sunt la distanțe diferite de nodul principal, primesc aceste notificări la momente diferite În același timp, știind cât de departe este de nodul principal, modemul poate calcula ora reală de pornire a mini-slot Lungimea mini-slotului este determinată de caracteristicile rețelei particulare Sarcina utilă a unui mini-slot este de obicei de octeți În timpul inițializării, headend-ul leagă fiecare modem la un anumit mini-slot, ca urmare, are posibilitatea de a trimite cereri de lățime de bandă În mod obișnuit, mai multe modemuri sunt legate la același mini-slot, ceea ce duce la dispute Înainte ca un pachet să fie trimis de la computer la rețea, acesta este trecut la modem, care apoi solicită numărul corespunzător de mini-sloturi Dacă cererea este acordată, nodul principal trimite o confirmare pe legătura descendentă indicând mini-sloturile rezervate pentru transmiterea pachetelor Mai departe, pornind de la primul mini-slot rezervat, începe trimiterea Solicitările de trimitere a pachetelor suplimentare sunt încorporate într-un câmp special de antet Dacă modemul nu primește o confirmare din cauza disputei pentru mini-slot solicitat, așteaptă o perioadă de timp aleatorie și repetă cererea Cu fiecare încercare nereușită, timpul de așteptare se dublează, contribuind la scurgerea traficului intens Legăturile în jos sunt gestionate diferit În primul rând, într-o transmisie în aval, există un singur expeditor - nodul principal Prin urmare, nu există nicio dispută, precum și necesitatea de a aloca mini-slot, care, în esență, nu este altceva decât un mijloc de multiplexare statistică a diviziunii în timp În al doilea rând, traficul în aval este de obicei mult mai intens decât traficul în amonte, deci este transmis în pachete de de octeți Pachetul, pe lângă sarcina utilă de de octeți, include codul de corectare a erorilor Reed-Solomon și alte câmpuri de serviciu Această dimensiune a pachetului este aleasă pentru compatibilitatea cu televiziunea digitală MPEG- - Capitolul Organizarea sistemelor informatice ca rezultat, canalele de legătură în jos ale semnalului de televiziune și ale datelor sunt formatate uniform Schema logică a acestor conexiuni este prezentată în fig Fibra optica Coaxial Downlink fără contestație: cablu de Mbps folosind tehnologia QAM- la transmiterea pachetelor cu o sarcină utilă de de octeți Legătură ascendentă de pachete litigioase: Mbps QPSK pe mini-sloturi de octeți Orez Organizarea standard a uplink-urilor și downlink-urilor în SUA Tehnologia QAM- (Quadrature Amplitude Modulation) permite transmisia la biți/Hz, dar funcționează doar la frecvențe înalte Tehnologia QPSK (modulație de fază în quadratură) funcționează la frecvențe joase, dar rata maximă de transmisie este de bps Modem Cu toate acestea, să revenim la procedura de inițializare a modemului După calibrare, primire uplink și downlink și atribuire mini-sloturi, modemul poate începe să transmită pachete Pachetele sunt trimise către headend, de la care merg printr-un canal dedicat către biroul central al operatorului de televiziune prin cablu, iar de acolo către furnizorul de servicii de internet (ISP), în calitate de operator însuși Primul pachet trimis furnizorului de servicii conține o solicitare de a furniza în mod dinamic o adresă de rețea (adresă IP) O altă întrebare din acest pachet se referă la ora exactă a zilei Următorul pas este abordarea problemelor de securitate Mulți utilizatori își transmit datele printr-un singur cablu (dacă sunteți interesat, încercați să vă uitați la statisticile privind traficul de trecere) Pentru a preveni ca vecinii să se urmărească reciproc, tot traficul, indiferent de direcția în care este trimis, este criptat fără greșeală Prin urmare, în timpul procesului de inițializare, printre altele, sunt determinate cheile de criptare S-ar părea că este imposibil să se negocieze o cheie secretă între modem și nodul principal sub privirea atentă a mii de utilizatori De fapt, acesta nu este cazul - algoritmul Diffie-Hellman [ ] este folosit pentru a determina cheia de criptare În cele din urmă, modemul se înregistrează în rețea și își comunică identificatorul unic printr-un canal securizat Acest lucru completează procesul de inițializare - utilizatorul poate începe să lucreze Revizuirea noastră a modemurilor prin cablu s-a dovedit a fi destul de concisă Consultați literatura suplimentară pentru detalii [ , , ] Intrare ieșire Camere digitale Din ce în ce mai multe tehnologii informatice sunt introduse în domeniul fotografiei digitale - chiar și acum camerele digitale sunt considerate în mod destul de legitim ca unul dintre tipurile de periferice pentru computer Să aruncăm o privire rapidă asupra modului în care funcționează Toate camerele sunt echipate cu un obiectiv care formează o imagine a obiectului din spatele camerei Într-o cameră tradițională, filmul fotografic acționează ca un purtător de imagini latente care se formează în momentul pătrunderii luminii Imaginile sunt dezvoltate în laborator prin expunerea la anumite elemente chimice Principiul de funcționare al unei camere digitale este similar cu o excepție - în loc de film, purtătorul de imagine devine o matrice dreptunghiulară de dispozitive fotosensibile cuplate la sarcină (Charge-Coupled Devices, CCD) (Unele camere digitale folosesc tehnologia CMOS, dar varianta CCD este mai comună ) Când lumina lovește un dispozitiv CCD, acesta primește o încărcare electrică Cu cât este mai multă lumină, cu atât este mai mare schimbarea încărcăturii Taxa este citită de convertorul analog-digital ca un număr întreg de la la (aparate foto cu preț redus) sau de la la (aparate reflex cu un singur obiectiv) Circuitul corespunzător este prezentat în Fig Un pixel este format pe baza valorilor a patru dispozitive CCD - unul roșu, unul albastru și două verzi Matricea dispozitivelor CCD CPU Memorie flash sau microdisc Camera digitala Orez Camera digitala Fiecare dispozitiv CCD, indiferent de lumina care cade pe el, generează o singură valoare de ieșire Pentru imagini color Capitolul Organizarea sistemelor informatice Dispozitivele CCD sunt grupate în grupuri de patru Un filtru Bayer este plasat deasupra grupului, ceea ce face ca un dispozitiv CCD să fie sensibil la roșu, celălalt la albastru și celelalte două la verde Prezența a două elemente verzi se explică prin doi factori: în primul rând, este mai convenabil, iar în al doilea rând, ochiul uman percepe verdele mai bine decât albastrul și roșu Dacă producătorul unei camere digitale susține că rezoluția acesteia este de milioane de pixeli, trebuie să știi că minte obrăzător Are milioane de dispozitive CCD, care împreună formează , milioane de pixeli Cu această rezoluție, imaginea este citită ca o matrice de x (în camerele ieftine) sau x (în camerele reflex cu un singur obiectiv) pixeli Pixelii suplimentari sunt generați prin interpolare software Când apăsați butonul de declanșare a obiectivului, software-ul camerei efectuează trei operații: setează focalizarea, determină expunerea și efectuează echilibrarea albului Focalizarea automată este realizată prin analiza datelor de imagine de înaltă frecvență și împingerea obiectivului la limita pentru detalii maxime La determinarea expunerii, se calculează mai întâi intensitatea luminii care cade pe CCD, după care se reglează diafragma și viteza obturatorului astfel încât valoarea intensității rezultată să scadă la mijlocul intervalului CCD Echilibrarea albului se reduce la măsurarea spectrului luminii incidente în scopul corecției ulterioare a culorii Apoi, imaginea este citită de pe CCD și stocată ca o matrice de pixeli în memoria RAM încorporată a camerei Aparatele foto reflex profesionale cu un singur obiectiv utilizate de fotojurnalişti pot filma opt cadre de înaltă rezoluţie pe secundă timp de cinci secunde; în același timp, cantitatea de RAM încorporată, în care imaginile sunt plasate înainte de procesarea ulterioară și stocarea permanentă, este destul de mare În camerele ieftine, memoria RAM este mai mică, dar suficientă După realizarea unei fotografii, software-ul efectuează corecția culorilor pe baza balansului de alb, neutralizând astfel excesul de lumină roșie sau albastră (care apare, de exemplu, atunci când fotografiați un subiect la umbră, precum și când utilizați un bliț) Apoi se efectuează algoritmi pentru reducerea zgomotului și corectarea dispozitivelor CCD defecte După aceea (dacă funcția corespunzătoare este activată), se încearcă ascuțirea imaginii - caută margini și crește intensitatea gradientului din jurul lor În cele din urmă, imaginea este comprimată pentru a reduce cantitatea de memorie pe care o ocupă Cel mai comun format folosit în acest scop este JPEG (Joint Photographic Experts Group) Acesta oferă o transformată Fourier spațială bidimensională și eliminarea componentelor de înaltă frecvență Imaginea finală este foarte compactă, dar detaliile fine se pierd La sfârșitul procesării, imaginea este scrisă pe un suport permanent, care este de obicei un card de memorie flash sau un mic dispozitiv detașabil Intrare ieșire Hard disk-ul este cunoscut și sub numele de microdisc Procesarea și înregistrarea fiecărei imagini durează câteva secunde Utilizatorul poate apoi conecta camera la computer prin, de exemplu, un cablu USB sau FireWire Acest lucru vă permite să transferați imagini din memoria camerei pe hard diskul computerului Cu ajutorul unui software special (de exemplu, editorul Adobe Photoshop), utilizatorul poate decupa imaginea, regla luminozitatea, contrastul și echilibrul, crește claritatea sau, dimpotrivă, poate estompa parțial imaginea, elimina elementele inutile și poate aplica filtre într-un mod arbitrar combinaţie Mulțumit de rezultat, utilizatorul este liber să imprime imaginile pe o imprimantă color, să le posteze pe Internet și să le inscripționeze pe un CD sau DVD pentru arhivare sau imprimare ulterioară În ceea ce privește puterea de calcul, cantitatea de RAM și spațiul pe disc, precum și complexitatea software-ului, camerele digitale reflex cu un singur obiectiv (Single-Lens Reflex, SLR) sunt comparabile cu sistemele desktop de acum doi sau trei ani Pe lângă operațiunile de mai sus, computerul unei astfel de camere trebuie să asigure interacțiunea cu lentilele și procesorul blitzului, să actualizeze imaginea de pe ecranul cu cristale lichide, fără a mai vorbi de coordonarea acțiunilor tuturor butoanelor, roților, indicatoarelor, afișajelor și alte dispozitive în timp real Codurile de caractere Fiecare computer are un set de caractere pe care îl folosește Cel puțin, acest set include de litere mari și de litere minuscule , numere de la la și câteva caractere speciale, inclusiv spațiu, punct, virgulă, minus, întoarcere transport etc Pentru a transmite aceste caractere către un computer, fiecăruia i se atribuie un număr, de exemplu: a = , b = , , z = , + = , - = Reprezentarea unui caracter ca număr întreg se numește cod de caractere Este important de reținut că computerele interconectate trebuie să accepte aceleași coduri de caractere, altfel nu vor putea face schimb de informații Din acest motiv, au fost elaborate standarde Aici ne vom uita la cele două cele mai importante ASCII Unul dintre cele două coduri utilizate în mod obișnuit se numește ASCII (American Standard Code for Information Interchange) Fiecare caracter ASCII conține biți, astfel încât un total de de caractere pot fi codificate Codurile de la la F (hexazecimal) corespund caracterelor de control care nu sunt tipărite (Tabelul ) În engleză - Notă transl Capitolul Organizarea sistemelor informatice Tabelul Tabel de coduri pentru caracterele de control ASCII Număr Nume Valoare Număr Nume Valoare NUL Zero DLE Data Link Escape SOH Începutul antetului Controlul dispozitivului DC STX Start of Text DC Device Control ETX Sfârșitul textului Controlul dispozitivului DC EOT Sfârșitul transmisiei Controlul dispozitivului DC Întrebare ENQ Recunoaștere negativă NAK ACK ACKnoligement SYN SYNcronous inactiv (Pauză) BEL Beli (Beep) ETB Sfârșitul blocului de transmisie BS BackSpace (Backback) CAN Cancel (Anulare) HT Filă orizontală EM Sfârșitul mediului A LF Line Feed A SUB Substitut (subscript) Â VT Fila verticală (tabulare verticală) Â ESC ESCape (Ieșire) С FF din flux (traducere pagină) С FS File Separator (separator de fișiere) D CR Carage Return D GS Group Separator E SO Shift Out E RS Record Separator F SI Shift In F US Unit Separator Intrare ieșire Multe caractere de control ASCII sunt pentru transmisia de date De exemplu, un mesaj poate consta din caracterul SOH (Start of Header), antetul în sine, caracterul STX (Start of Text), textul însuși, caracterul ETX (End of Text) și în final EOT (sfârșitul textului) transmitere) Cu toate acestea, în practică, mesajele trimise prin linii telefonice și rețele sunt formatate diferit, astfel încât caracterele de control ASCII sunt cu greu utilizate pentru transmisie Caracterele ASCII imprimabile includ litere mari și mici, numere, semne de punctuație și unele simboluri matematice (Tabelul ) Tabelul Tabel de coduri pentru caracterele ASCII imprimabile Număr Simbol Număr Simbol Număr Număr Simbol Număr Simbol Număr Simbol Număr Simbol (spațiu) @ P P A Q a Q V R b R # S S S S $ D T d T % E și e u & F V f V G W g W ( H X h X ) I Y i Y A * PENTRU A J A Z A j A z B + B B K B [ B k B { С ЗС E N E l E n E F / F? F O F F F DEL UNICODE Industria calculatoarelor s-a dezvoltat predominant în SUA, rezultând un cod ASCII mai potrivit pentru engleză decât pentru alte limbi Franceza are accente, germana are umlauts și așa mai departe Unele limbi europene au câteva litere care nu sunt în setul de caractere ASCII Unele limbi au un alfabet complet diferit (cum ar fi rusă sau arabă), iar unele nu au deloc un alfabet (cum ar fi chineza) Calculatoarele s-au răspândit în toată lumea, iar furnizorii de software vor să-și vândă produsele fără Capitolul Organizarea sistemelor informatice numai în țările vorbitoare de engleză, dar și în acele țări în care majoritatea utilizatorilor nu vorbesc engleza și este nevoie de un set de caractere diferit Prima încercare de extindere a codului ASCII a fost IS , care a adăugat încă de caractere la setul de caractere ASCII, rezultând un set de caractere de biți numit Latin- Au fost adăugate în mare parte litere latine cu linii și semne diacritice Următoarea încercare a fost standardul IS , care a introdus conceptul de pagină de cod O pagină de coduri este un set de de caractere pentru o anumită limbă sau un grup de limbi, în IS - acesta este setul Latin-І IS - include limbi slave cu alfabet latin (de exemplu, cehă, poloneză și maghiară), IS - descrie caractere pentru turcă, malteză, galică, esperanto etc Principalul dezavantaj al acestei abordări este că software-ul Software-ul trebuie să controleze cu ce pagină de cod are de-a face, iar amestecarea limbilor este inacceptabilă De asemenea, acest sistem nu acoperă japoneză și chineză Un grup de companii de calculatoare au rezolvat această problemă prin crearea unui nou sistem de codare numit UNI CODE și au declarat acest sistem standard internațional (IS ) UNICODE este suportat de unele limbaje de programare (cum ar fi Java), unele sisteme de operare (cum ar fi Windows NT) și multe aplicații Este probabil ca acest sistem să se răspândească în întreaga lume Ideea de bază a UNICODE este de a atribui fiecărui caracter o singură valoare constantă de biți, care se numește indicator de cod Caracterele multiocteți și caracterele wildcard nu sunt utilizate Deoarece fiecare caracter are o lungime de biți, scrierea software-ului este mult mai ușoară Deoarece caracterele UNICODE au o lungime de biți, există în total de puncte de cod Deoarece toate limbile din lume au un total de aproximativ de caractere, punctele de cod sunt o resursă foarte rară care trebuie alocată cu mare grijă Aproximativ jumătate din coduri au fost deja distribuite, iar consorțiul care a dezvoltat UNICODE ia în considerare în mod constant propuneri pentru distribuirea restului Pentru a accelera adoptarea sistemului UNICODE, consorțiul a folosit setul Latin-I pentru codurile de la la , care oferă o conversie ușoară de la caracterele ASCII- în UNICODE Pentru a evita risipa de coduri, fiecare diacritic are propriul cod, iar combinarea unui diacritic cu o anumită literă este sarcina software-ului Întregul set de coduri este împărțit în blocuri, fiecare bloc conține coduri Fiecare alfabet din UNICODE are un număr de zone consecutive Iată câteva exemple (numărul de coduri implicate este indicat între paranteze): latină ( ), greacă ( ), rusă ( ), armeană ( ), ebraică ( ), Devanagari ( ), Gurmuk ( ) , Oriya ( ) ), Telugu ( ) și Kannada ( ) Rețineți că fiecăreia dintre aceste limbi i se atribuie mai multe coduri decât litere Acest lucru se datorează parțial pentru că, în multe limbi, fiecare literă are mai multe ortografii De exemplu, fiecare literă în limba engleză este reprezentată în două versiuni: există litere mici și mari În unele limbi, literele au trei sau mai multe forme de scriere, alegerea unei anumite variante depinde de locul în care se află litera: la începutul, sfârșitul sau mijlocul cuvântului Rezumatul capitolului În plus, unele coduri au fost atribuite semnelor diacritice ( ), semnelor de punctuație ( ), subscriptelor și superscriptelor ( ), semnelor valutare ( ), simbolurilor matematice ( ), figurilor geometrice ( ), desenelor ( ) De asemenea, aveți nevoie de caractere pentru chineză, japoneză și coreeană Mai întâi vin de caractere fonetice (cum ar fi katakana și bopomofo), apoi caracterele folosite în chineză și japoneză ( ), apoi silabele coreene ( ) Pentru ca utilizatorii să creeze personaje noi în scopuri speciale, există încă de coduri Deși sistemul UNICODE a rezolvat multe dintre problemele asociate internaționalizării, tot nu a rezolvat absolut toate problemele De exemplu, alfabetul latin este ordonat, dar caracterele nu sunt, așa că un program în limba engleză poate alfabetiza cuvintele "pisică" și "câine" comparând semnificația codurilor primelor litere, dar un program japonez are nevoie de tabele suplimentare pentru a să poată calcula, în ordinea în care caracterele sunt în dicționar O altă problemă este că apar în mod constant cuvinte noi Acum de ani nimeni nu vorbea despre applet-uri, cyberspace, gigabytes, lasere, modemuri, emoticoane sau casete video Apariția unor cuvinte noi în engleză nu necesită coduri noi, dar în japoneză sunt necesare Pe lângă noile termeni, trebuie adăugate și cel puțin de noi nume proprii și nume de locuri (în mare parte chinezești) Braille, care este folosit de nevăzători, ar trebui probabil inclus și Reprezentanții diferitelor comunități profesionale sunt, de asemenea, interesați de prezența anumitor simboluri speciale Consorțiul UNICODE analizează și decide asupra tuturor propunerilor noi Sistemul UNICODE folosește același cod pentru caractere care arată aproape la fel, dar au mai multe semnificații sau sunt scrise ușor diferit în chineză și japoneză (ca și cum procesoarele de text în engleză ar fi scris întotdeauna "blow" ca "blow", deoarece sunt pronunțate la fel) Unii consideră că această abordare este optimă pentru salvarea unei surse slabe de coduri, alții o văd drept imperialism cultural anglo-saxon (credeți că alocarea de valori pe biți caracterelor nu era politică?) Treaba este complicată de faptul că dicționarul japonez complet conține de caractere (fără a număra numele proprii), așa că, cu de coduri, trebuie să faci alegeri și să sacrifici ceva Nu toți japonezii cred că un consorțiu de companii de calculatoare, chiar dacă unele dintre ele sunt japoneze, este locul ideal pentru a decide ce să sacrifice Rezumatul capitolului Sistemele informatice sunt alcătuite din trei componente: procesoare, memorie și dispozitive de intrare/ieșire Scopul procesorului este de a apela secvenţial instrucţiuni din memorie, de a le decoda şi de a le executa Ciclu Capitolul Organizarea sistemelor informatice apel - decodare - execuție poate fi întotdeauna reprezentată ca un algoritm Apelarea, decodarea și executarea instrucțiunilor unui anumit program sunt uneori efectuate de un program interpret care rulează la un nivel inferior Pentru a îmbunătăți performanța, multe computere au una sau mai multe conducte sau suportă o arhitectură superscală cu mai multe blocuri funcționale care funcționează în paralel Sistemele cu procesoare multiple sunt răspândite Calculatoarele cu procesare paralelă includ procesoare matrice, în care aceeași operațiune este efectuată simultan pe seturi diferite de date; multiprocesoare, în care mai multe procesoare au o memorie comună; și multicalculatoare, în care fiecare computer are propria sa memorie, dar calculatoarele sunt interconectate și își trimit mesaje unul altuia Memoria poate fi împărțită în primară și secundară Memoria principală este folosită pentru a stoca programe care rulează în prezent Timpul de acces este scurt (cel mult câteva zeci de nanosecunde) și nu depinde de adresa accesată Memoria cache reduce și mai mult timpul de acces Memoria poate fi echipată cu un cod de corectare a erorilor pentru a îmbunătăți fiabilitatea Timpul de acces la memoria auxiliară, pe de altă parte, este mult mai lung (de la câteva milisecunde și mai mult) și depinde de locația datelor citite și scrise Cele mai comune tipuri de stocare auxiliară sunt benzile magnetice, discurile magnetice și discurile optice Discurile magnetice sunt disponibile în mai multe varietăți: dischete, hard disk, discuri IDE, discuri SCSI și matrice RAID Discurile optice includ CD-uri, CD-R și DVD-uri Dispozitivele I/O sunt folosite pentru a transfera informații către și de la un computer Acestea sunt conectate la procesor și memorie prin una sau mai multe magistrale Exemplele includ terminale, șoareci, imprimante și modemuri Majoritatea dispozitivelor I/O folosesc cod ASCII, deși UNICODE se răspândește deja rapid în întreaga lume Întrebări și sarcini Luați în considerare o mașină cu calea datelor prezentată în fig Să presupunem că încărcarea registrelor ALU durează ns, rularea ALU durează ns, iar repunerea rezultatului în registru durează ns Care este numărul maxim de milioane de instrucțiuni pe secundă pe care această mașină este capabilă să le execute în absența unei conducte? De ce este necesar pasul în lista de pași din secțiunea Executarea comenzilor din secțiunea Procesoare? Ce se întâmplă dacă acest pas este omis? Pe computerul , fiecare instrucțiune durează ns pentru a fi finalizată, iar pe computerul durează ns Poti spune cu certitudine ca computerul este mai rapid? Justificati raspunsul Întrebări și sarcini Să presupunem că proiectați un computer cu un singur cip pentru a fi utilizat în sistemele încorporate Toată memoria este pe un cip și funcționează la aceeași viteză ca procesorul Examinați principiile prezentate în subsecțiunea "Principii de proiectare pentru calculatoare moderne" din secțiunea "Procesoare" și spuneți dacă sunt importante în acest caz (performanța ridicată este de dorit) În unele calcule, fiecare pas ulterior depinde de cel anterior Ce este mai potrivit de utilizat în acest caz, un procesor matrice sau o conductă? Explică de ce Pentru a concura cu tipografia nou inventată, o mănăstire medievală a decis să producă în masă cărți scrise de mână Pentru a face acest lucru, un număr mare de cărturari s-au adunat într-o sală mare Starețul mănăstirii a chemat primul cuvânt al cărții și toți cărturarii l-au notat Atunci starețul a chemat al doilea cuvânt și toți cărturarii l-au notat Acest proces a fost repetat până când întreaga carte a fost citită cu voce tare și rescrisă Cu care dintre sistemele de procesare paralelă enumerate în subsecțiunea Paralelism la nivel de procesor din secțiunea Procesoare este cel mai asemănător acest sistem? Când treceți de sus în jos în structura ierarhică pe cinci niveluri a memoriei, timpul de acces crește Care este raportul dintre timpul de acces la un disc optic și la o memorie înregistrată? (Presupunând că un disc este deja introdus ) Atunci când efectuează un sondaj standard (de exemplu, "Credeți că zâna dinților există?"), sociologii se așteaptă să primească unul dintre cele trei răspunsuri de la respondenți: "da", "nu" sau "nu pot spune orice despre asta" Să presupunem că având în vedere acest lucru, Socimagnetic Computer decide să construiască un computer pentru a procesa datele sondajului Acest computer implementează memoria ternară; cu alte cuvinte, fiecare octet (mai precis, "trite") este format din trits, iar fiecare trit poate lua valoarea , sau De câte trituri aveți nevoie pentru a stoca un număr de biți? Scrieți o formulă pentru a calcula numărul de triți necesari pentru a stoca n biți Calculați rata de date în ochiul uman utilizând următoarele informații Câmpul vizual este format din aproximativ elemente (pixeli) Fiecare pixel poate fi format prin suprapunerea a trei culori primare, fiecare având de grade de intensitate Rezoluția în timp este de de milisecunde Calculați rata de date în urechea umană din următoarele date O persoană aude sunete la frecvențe de până la kHz Pentru a determina toate informațiile conținute într-un semnal audio de kHz, trebuie să luați "eșantionul" acestuia la o frecvență dublă - kHz O mostră de biți este suficientă pentru a capta toate datele auditive (deoarece nu mai mult de de niveluri de intensitate a sunetului sunt disponibile pentru ureche) I Informaţia genetică la toate fiinţele vii este codificată în moleculele de ADN Molecula de ADN este o secvență liniară de patru Capitolul Organizarea sistemelor informatice nucleotide de bază: A, C, G și T Genomul uman conține aproximativ x IO nucleotide sub formă de de gene Care este capacitatea totală de informare a genomului uman (în biți)? Care este capacitatea medie de informare a unei gene (în biți)? Un computer poate stoca de octeți de memorie De ce au ales dezvoltatorii un astfel de număr impar în loc de ceva memorabil precum ? Veniți cu un cod Hamming de biți cu biți de paritate pentru biții de la la Vino cu un cod pentru cifrele de la la cu un interval Hamming de În codul Hamming, unii biți sunt "gol" în sensul că sunt folosiți pentru verificare și nu poartă nicio informație Ce procent de biți goli sunt conținute în mesajele a căror lungime totală (date plus biți de verificare) este n - ? Calculați valoarea acestei expresii pentru n de la la Discul prezentat în fig are de sectoare pe pistă și o viteză de rotație de rpm Care este rata de date pe o singură pistă? Calculatorul conține o magistrală cu un timp de interogare de ns Într-un ciclu de interogare, poate citi din memorie sau scrie în memorie un cuvânt de de biți Computerul are o unitate Ultra -SCSI care folosește o magistrală și transferă informații la MB/s CPU apelează de obicei din memorie și execută o instrucțiune pe de biți la fiecare ns Cât de mult încetinește un disc un procesor? Imaginați-vă că scrieți software pentru partea sistemului de operare care este responsabilă de gestionarea discurilor În mod logic, te gândești la un disc ca la o secvență de blocuri de la în interior până la un maxim în exterior Când fișierele sunt create, trebuie să alocați memorie în sectoare libere Vă puteți deplasa de la marginea exterioară spre interior sau invers Contează ce strategie să alegi? Explică-ți răspunsul Cât durează să citești un disc cu de cilindri, fiecare conținând piste de de sectoare? În primul rând, sunt citite toate sectoarele piesei , începând de la sectorul , apoi toate sectoarele piesei , începând de la sectorul și așa mai departe, părți ale discului - până la ms Trecerea de la o cale a cilindrului la alta este instantanee Nivelul RAID poate corecta erorile pe un singur bit folosind un singur disc de paritate Ce se întâmplă într-o matrice RAID de nivel ? La urma urmei, poate corecta și erori individuale, dar folosește mai multe discuri Întrebări și sarcini Care este capacitatea exactă (în octeți) a unui CD-ROM de tip care conține de minute de date (dimensiune personalizată)? Care este capacitatea datelor utilizatorului de pe un disc de tip ? Pentru a inscripționa un disc CD-R, laserul trebuie să se pornească și să se oprească foarte repede Care este durata pulsului (pornit și oprit) în nanosecunde dacă un CD de tip este înregistrat la x? Pentru a încadra un film de de minute pe un DVD cu un singur strat este nevoie de puțină compresie Calculați cât aveți nevoie pentru a comprima filmul Se presupune că o pistă de imagine are nevoie de , GB pentru a fi înregistrată, rezoluția imaginii este de x pixeli cu culoare pe de biți și se schimbă de cadre pe secundă Datele de pe discuri Blu-ray de GB sunt citite la , Mbps Cât durează să citești toate datele de pe un astfel de disc? Rata de transfer de date între unitatea centrală de procesare și memoria asociată acesteia este cu câteva ordine de mărime mai mare decât rata de transfer de date de la dispozitivele I/O mecanice Cum ar putea această nepotrivire să provoace degradarea performanței? Cum poate fi atenuată această degradare a performanței? Producătorul spune că terminalul său grafic color poate afișa de culori diferite Cu toate acestea, hardware-ul are doar octet pentru fiecare pixel Cum obții atâtea culori? Terminalul grafic are un monitor de x pixeli Imaginea de pe monitor se schimbă de de ori pe secundă Cât de des se schimbă un pixel individual? O imprimantă laser monocromă poate imprima de linii de de caractere într-un anumit font pe o coală Un caracter ocupă un spațiu mediu de x mm, tonerul ocupând % din acest spațiu, iar restul rămânând alb Stratul de toner are o grosime de de microni Cartușul de toner măsoară x x cm Câte pagini va dura cartuşul? Când textul ASCII verificat de paritate este transmis asincron la de caractere/s printr-un modem care transmite informații la bps, ce procent din biții primiți conține date (adică nu conțin supraîncărcare)? O companie de modem a dezvoltat un nou modem FM care folosește de frecvențe în loc de Fiecare secundă este împărțită în n intervale de timp egale, fiecare conținând unul dintre cele de tonuri posibile Câți biți pe secundă poate transmite acest modem în cazul transmisiei sincrone? Să presupunem că un anumit utilizator este conectat la ADSL cu o rată de transfer de date de Mbps, iar vecinul său este conectat la o linie de Internet prin cablu cu o lățime de bandă totală de MHz Schema de modulație este QAM- Există n case conectate la cablu, câte un computer în fiecare O parte (/) a acestor computere în orice moment dat Capitolul Organizarea sistemelor informatice deconectat de la rețea În ce condiții viteza de transmitere a datelor prin cablu va depăși viteza de acces la Internet printr-o linie ADSL? Într-o cameră digitală cu o rezoluție de x pixeli, octeți sunt alocați pe pixel pentru transmiterea culorilor modelului RGB Producătorul camerei dorește ca o imagine JPEG cu un raport de compresie de x să fie scrisă pe un card de memorie flash în secunde Cu ce viteză de date poate fi îndeplinită această cerință? O cameră profesională are un imager de milioane de pixeli și octeți sunt alocați pentru transmiterea culorii în fiecare dintre pixeli Câte imagini pot fi stocate pe un card de memorie flash de GB cu un raport de compresie de x? Să presupunem, pentru simplitatea calculelor, că GB este egal cu de octeți Estimați câte caractere (inclusiv spații) conține o carte tipică de informatică Câți biți sunt necesari pentru a codifica o carte în cod ASCII cu paritate uniformă? De câte CD-uri aveți nevoie pentru a stoca de cărți de informatică? De câte DVD-uri față-verso, cu două straturi aveți nevoie pentru a stoca același număr de cărți? Scrieți o procedură hamming(ascii, codificat) care convertește biți ascii consecutivi într-un întreg codificat AND-bit Scrieți o funcție distanță (cod, n, k) care ia ca intrare un cod matrice de n caractere, k biți fiecare, și returnează abaterea statistică a caracterelor capitolul Nivel logic digital În partea de jos a diagramei ierarhice din Fig este nivelul logic digital sau hardware-ul computerului În acest capitol, ne vom uita la diferite aspecte ale logicii digitale, care ar trebui să formeze baza studiului nivelurilor superioare în capitolele următoare Subiectul de studiu se află la granița informaticii și ingineriei electrice, dar materialul este autosuficient, așa că nu este necesară cunoașterea prealabilă cu hardware și inginerie electrică Elementele de bază din care sunt construite calculatoarele digitale sunt extrem de simple Ne vom uita mai întâi la aceste elemente de bază, precum și la algebra specială cu două valori (algebra booleană) care este utilizată în construirea acestor elemente Apoi vom studia circuitele de bază care pot fi construite din porți în diverse combinații, inclusiv circuite pentru efectuarea de operații aritmetice Următorul subiect este despre cum să combinați porțile pentru a stoca informații, adică cum să construiți o memorie După aceea, vom trece la procesoare și la modul în care procesoarele de pe un singur cip comunică cu memoria și perifericele Ne uităm apoi la diverse exemple luate din industria calculatoarelor Gates și algebra booleană Circuitele digitale pot fi construite dintr-un număr mic de elemente simple prin combinarea acestor elemente în diferite combinații Următoarele subsecțiuni descriu aceste elemente de bază, arată cum pot fi combinate și introduc o metodă matematică pentru analizarea modului în care funcționează supape Un circuit digital este un circuit care are doar două valori booleene De obicei, un semnal de la la V reprezintă o valoare (de exemplu, ), iar un semnal de la la V reprezintă o altă valoare (de exemplu, ) Tensiunea în afara valorilor specificate nu este permisă Dispozitivele electronice minuscule numite porți permit ca din aceste semnale din două cifre să fie derivate diferite funcții Porțile sunt în centrul hardware-ului pe care sunt construite toate computerele digitale Descrierea modului în care funcționează porțile nu intră în domeniul de aplicare al acestei cărți, deoarece se referă la nivelul dispozitivului fizic, care este sub nivelul Cu toate acestea, vom atinge foarte pe scurt principiul de bază conform căruia Capitolul Nivel logic digital nu atât de complicat Toată logica digitală modernă se bazează pe faptul că un tranzistor poate acționa ca un comutator binar foarte rapid Pe fig a prezintă un tranzistor bipolar construit într-un circuit simplu Tranzistorul are trei conexiuni cu lumea exterioară: colector, bază și emițător Dacă tensiunea de intrare Vip este sub o anumită valoare critică, tranzistorul se oprește și acționează ca o rezistență foarte mare Aceasta are ca rezultat un semnal de ieșire Vout aproape de Vcc (tensiune furnizată extern) •- pentru acest tip de tranzistor acesta este de obicei + V este O B) Orez Invertor cu tranzistori (a); poarta NU ȘI (b); NU SAU poarta (c) Este important de reținut că dacă Vip este scăzut, atunci Vout este ridicat și invers Acest circuit este astfel un invertor care transformă logic în logic și logic în logic Rezistorul (linia întreruptă) este necesar pentru a limita curentul prin tranzistor, astfel încât tranzistorul să nu se ardă Trecerea de la o stare la alta durează de obicei câteva nanosecunde Pe fig , b două tranzistoare sunt conectate în serie Dacă atât Vlf, cât și V sunt mari, ambele tranzistoare devin conductori și reduc Vout Dacă una dintre tensiunile de intrare este scăzută, atunci tranzistorul corespunzător se oprește și tensiunea de ieșire devine ridicată Cu alte cuvinte, Vout este scăzut dacă și numai dacă atât V , cât și V sunt mari Pe fig , două tranzistoare sunt conectate în paralel Dacă una dintre intrări este ridicată, tranzistorul corespunzător pornește și reduce ieșirea Dacă ambele tensiuni de intrare sunt scăzute, atunci tensiunea de ieșire devine ridicată Aceste trei circuite formează trei porți simple Ele sunt numite porți NOT, NAND și, respectiv, NOR Porțile NU sunt adesea denumite inversate Gates și algebra booleană ramie Vom folosi ambii termeni Dacă acceptăm convenția conform căreia tensiunea înaltă (Vcc) este un logic și tensiunea joasă (masă) este un logic, atunci putem exprima valoarea de ieșire în funcție de valorile de intrare Pictogramele care sunt folosite pentru a descrie aceste trei tipuri de supape sunt prezentate în fig , a-c Acolo sunt prezentate și modurile de funcționare ale funcției pentru fiecare schemă În aceste figuri, A și B sunt semnale de intrare, X este semnalul de ieșire Fiecare rând de tabel definește un semnal de ieșire pentru diferite combinații de semnale de intrare A X Orez Pictograme pentru reprezentarea celor cinci supape principale Moduri de funcționare pentru fiecare supapă Dacă semnalul de ieșire din Fig , b alimentează invertorul, obținem un alt circuit opus porții NAND, adică unul în care semnalul de ieșire este dacă și numai dacă ambele semnale de intrare sunt Un astfel de circuit se numește poartă AND; imaginea acestuia și descrierea funcției corespunzătoare sunt date în fig , d În mod similar, o poartă NOR poate fi conectată la un invertor Apoi obținem un circuit în care semnalul de ieșire este egal cu dacă cel puțin unul dintre semnalele de intrare este unitate și este egal cu dacă ambele semnale de intrare sunt zero O imagine a acestui circuit, care se numește o poartă SAU, precum și o descriere a funcției corespunzătoare, sunt date în fig , e Cercurile mici din circuitele invertorului, porții NAND și porții NOR sunt numite ieșiri inversoare Ele pot fi folosite și în alte contexte pentru a indica un semnal inversat Cele cinci supape prezentate în fig formează baza nivelului logic digital Ar trebui să fie clar din discuția de mai sus că porțile NAND și NOR necesită câte doi tranzistori fiecare, iar porțile AND și OR necesită câte trei tranzistoare Din acest motiv, multe computere folosesc porți NAND și NOR mai degrabă decât porți AND și OR (În practică, toate porțile sunt construite oarecum diferit, dar porțile NAND și NOR sunt oricum mai simple decât AND și SAU ) Trebuie menționat că porțile pot avea mai mult de două intrări În principiu, o poartă NAND, de exemplu, poate avea un număr arbitrar de intrări, dar în practică, de obicei, nu există mai mult de opt Deși proiectarea supapelor este la nivelul dispozitivelor fizice, vom menționa în continuare principalele linii de tehnologii de fabricație, deoarece acestea sunt adesea Capitolul Nivel logic digital sunt menționate în literatură Cele două tehnologii principale sunt bipolare și MOS (metal, oxid, semiconductor) Tehnologiile bipolare includ TTL (Tranzistor-Tranzistor Logic), care a fost coloana vertebrală a electronicii digitale de mulți ani, și ECL (Emitter-Coupled Logic), care este utilizat atunci când sunt necesare operațiuni de mare viteză În ceea ce privește circuitele de calcul, tehnologia MOS este mai comună Supapele MOS sunt mai lente decât TTL și ECL, dar consumă mult mai puțină energie și ocupă mult mai puțin spațiu, astfel încât un număr mare de astfel de supape pot fi aranjate compact Supapele MOS sunt disponibile în mai multe varietăți: MOS cu canal p, MOS cu canal n și MOS complementar Deși MOSFET-urile sunt proiectate diferit de tranzistoarele bipolare, ele pot funcționa și ca comutatoare electronice Procesoarele și memoria moderne sunt cel mai adesea fabricate folosind tehnologia MOS complementară, care funcționează la + , V Atât putem spune despre nivelul dispozitivului fizic Cititorii care doresc să afle mai multe despre acest nivel se pot referi la literatura citată în capitolul algebră booleană Pentru a descrie circuite obținute prin combinarea diferitelor porți, avem nevoie de un tip special de algebră în care toate variabilele și funcțiile pot lua doar două valori: și O astfel de algebră se numește booleană Este numit după matematicianul englez George Boole ( - ) De fapt, în acest caz, vorbim despre un tip special de algebră booleană, și anume algebra circuitelor releu, dar termenul de "algebră booleană" este foarte des folosit în sensul de "algebră a circuitelor relee", așa că vom nu face distincție între ele La fel ca algebra obișnuită (adică cea care se studiază la școală), algebra booleană are propriile sale funcții O funcție booleană ia una sau mai multe variabile ca intrare și produce un rezultat care depinde numai de valorile acelor variabile Se poate defini o funcție simplă / spunând că f(A) = dacă A = și f(A) = dacă A = O astfel de funcție ar fi o funcție NOT (vezi Figura a) Deoarece o funcție booleană de n variabile are doar " combinații posibile de valori variabile, o astfel de funcție poate fi descrisă complet într-un tabel cu rânduri de " Fiecare linie va da valoarea funcției pentru diferite combinații de valori variabile Un astfel de tabel se numește tabel de adevăr Toate tabelele din fig sunt tabele de adevăr Dacă suntem de acord să aranjam întotdeauna rândurile tabelului de adevăr în ordine numerică, adică pentru două variabile în ordinea , , , AND, atunci funcția poate fi complet descrisă printr-un număr binar de "biți, care este obţinute prin citirea coloanei rezultat din tabelul pe verticală adevăr Astfel, NAND este , NOR este , AND este și OR este Evident, există doar funcții booleene a două variabile, care corespund la șiruri posibile de biți În algebra obișnuită, dimpotrivă, există un număr infinit de funcții a două variabile și niciuna dintre ele Gates și algebra booleană nu poate fi descris dând un tabel cu valorile acestei funcții pentru toate valorile posibile ale variabilelor de intrare, deoarece fiecare variabilă poate lua un număr infinit de valori Pe fig , a arată tabelul de adevăr pentru o funcție booleană a trei variabile: M = / (L, B, C) Aceasta este o funcție majoritară care ia valoarea dacă majoritatea variabilelor sunt , sau dacă majoritatea variabilelor sunt Deși orice funcție booleană poate fi definită folosind un tabel de adevăr, acest tip de notație devine greu de utilizat pe măsură ce numărul de variabilele cresc Prin urmare, în loc de tabele de adevăr, este adesea folosită o altă notație A în cu m Orez Tabelul de adevăr pentru funcția majoritară a trei variabile (a); schema de implementare a acestei funcții (b) Pentru a vedea acest alt tip de notație, rețineți că orice funcție booleană poate fi definită prin specificarea combinațiilor de valori ale variabilelor de intrare care au ca rezultat o valoare unitară a funcției Pentru funcția prezentată în fig , a, există combinații de variabile care dau o singură valoare a funcției Vom desena o bară peste variabilă pentru a indica faptul că valoarea acesteia este inversată Absența unei liniuțe înseamnă că valoarea variabilei Capitolul Nivel logic digital nu este inversată În plus, vom folosi semnul de înmulțire (punct) pentru a reprezenta funcția booleană AND (acest semn poate fi omis) și semnul de adunare (+) pentru a reprezenta funcția booleană SAU De exemplu, ABC este numai dacă L = , B = și C= De asemenea, AB + BC este numai dacă (A = și B = ) sau (B = și C = ) În tabelul din fig , iar funcția ia valoarea în patru linii: ABC, ABC, ABC și ABC Funcția M se evaluează la adevărat (adică ) dacă una dintre aceste patru condiții este adevărată Prin urmare, putem scrie M = ABC + ABC + ABC + ABC Aceasta este o notație compactă a tabelului de adevăr Astfel, o funcție a n variabile poate fi descrisă prin suma a cel mult n produse, fiecare produs având n factori După cum vom vedea în scurt timp, această formulare este deosebit de importantă deoarece permite implementarea acestei funcții folosind porți standard Este important să înțelegem diferența dintre o funcție booleană abstractă și implementarea ei cu un circuit electronic O funcție booleană constă din variabile, cum ar fi A, B și C, precum și operatori AND, OR și NOT O funcție booleană este descrisă folosind un tabel de adevăr sau o notație specială, de exemplu: F = ABC + ABC O funcție booleană poate fi implementată de un circuit electronic (adesea în diferite moduri) folosind semnale care reprezintă variabile de intrare și ieșire și porți precum AND, OR și NOT Implementarea funcţiilor booleene După cum sa menționat mai devreme, reprezentarea unei funcții booleene ca o sumă de produse de cel mult " face posibilă implementarea acestei funcții Pe fig , b, semnalele de intrare A, B și C sunt afișate în partea stângă, iar funcția M obținută la ieșire este afișată în dreapta Deoarece sunt necesare valori suplimentare (inversări) ale variabilelor de intrare, semnalul trece prin invertoarele , și pentru a le obține Pentru a face figura mai clară, am trasat linii verticale, dintre care sunt asociate cu intrarea variabile, altele - cu inversiunile lor Aceste linii transportă semnalul de intrare către supape De exemplu, porțile , și primesc un semnal A la intrarea lor Într-un circuit real, aceste porți ar fi probabil conectate direct la A fără fire verticale între ele Circuitul conține patru porți AND, câte una pentru fiecare termen din ecuația pentru M (adică una pentru fiecare rând din tabelul de adevăr cu un rezultat de ) Fiecare poartă AND evaluează unul dintre rândurile specificate ale tabelului de adevăr În final, toate aceste produse sunt însumate (adică operația SAU) pentru a obține rezultatul final Uită-te la fig b În această carte, vom folosi următoarea convenție: dacă două linii dintr-un desen se intersectează, relația este implicită Gates și algebra booleană numai dacă există un punct aldine la intersecție De exemplu, ieșirea porții intersectează toate cele linii verticale, dar este conectată doar la linia C Rețineți că alți autori pot folosi convenții diferite Din fig ar trebui să fie clar cum să obțineți schema pentru orice funcție booleană: Faceți un tabel de adevăr pentru această funcție Includeți invertoare în circuit pentru a putea inversa fiecare semnal de intrare Desenați o poartă AND pentru fiecare rând al tabelului de adevăr cu rezultatul Conectați porțile AND la semnalele de intrare corespunzătoare Ieșiți ieșirile tuturor porților AND și direcționați-le către intrarea porții SAU Am arătat cum să implementăm orice funcție booleană folosind porțile NOT, AND și OR Cu toate acestea, este mult mai convenabil să construiți circuite folosind un singur tip de poartă Din fericire, este ușor să convertiți circuitele construite conform algoritmului anterior într-o formă NAND sau NOR Pentru a implementa această transformare, tot ce trebuie să facem este să implementăm porțile NOT, AND și OR cu un singur tip de poartă Figura arată cum se face acest lucru cu o poartă NAND sau NOR Rețineți că există și alte opțiuni pentru o astfel de transformare Orez Construcția porților NOT (a), AND (b) și OR (c) numai pe baza unei porți NAND sau NOR Capitolul Nivel logic digital Pentru a implementa o funcție booleană bazată doar pe o poartă NAND sau NOR, puteți urma mai întâi algoritmul descris prin construirea unui circuit cu porți NOT, AND și OR Apoi, trebuie să înlocuiți supapele cu mai multe porturi cu circuite echivalente pe ventile cu două porturi De exemplu, A + B + C + D poate fi schimbat în (A + B) + (C + D) utilizând trei porți cu două sensuri Apoi porțile NOT, AND și OR sunt înlocuite cu circuitele prezentate în fig Deși această procedură nu conduce la circuite optime în ceea ce privește numărul minim de porți, ea demonstrează că o astfel de transformare este fezabilă Porțile NAND și NOR sunt considerate complete deoarece fiecare dintre ele vă permite să evaluați orice funcție booleană Nicio altă poartă nu are această proprietate, motiv pentru care aceste două tipuri de porți sunt preferate la construirea circuitelor Echivalența schemei Proiectanții de circuite încearcă adesea să reducă numărul de porți pentru a reduce prețul, a reduce spațiul ocupat de circuit, a reduce consumul de energie etc Pentru a simplifica circuitul, proiectantul trebuie să găsească un alt circuit care să poată calcula aceeași funcție, dar necesită mai puține porți (sau pot funcționa cu supape mai simple, cum ar fi supape cu căi în loc de supape cu căi) Algebra booleană este un instrument valoros în găsirea circuitelor echivalente Ca exemplu de utilizare al algebrei booleene, luați în considerare circuitul și tabelul de adevăr pentru funcția AB + AC (Fig , a) Deși nu am discutat încă, multe dintre regulile algebrei obișnuite se aplică și algebrei booleene De exemplu, expresia AB + AC conform legii distribuției poate fi transformată în A (B + Figura , b prezintă circuitul și tabelul de adevăr pentru funcția A (B + Două funcții sunt echivalente dacă și numai dacă ambele funcții iau aceeași valoare pentru toate variabilele posibile Din tabelele de adevăr din Fig este clar că funcția A(B + este echivalentă cu funcția AB + AC În ciuda acestei echivalențe, circuitul din Fig b este mai simplu decât circuitul din Fig , a, deoarece conține mai puține porți De obicei, un dezvoltator începe de la o anumită funcție booleană și apoi îi aplică legile algebrei booleene pentru a găsi o funcție mai simplă care să fie echivalentă cu cea originală Pe baza funcției rezultate, puteți proiecta un circuit Pentru a utiliza această abordare, trebuie să cunoașteți câteva relații (legi) ale algebrei booleene, care sunt prezentate în tabel Este interesant de observat că fiecare raport are două forme O formă poate fi obținută dintr-o alta prin schimbarea AND la SAU și la Toate relațiile pot fi dovedite cu ușurință prin compilarea tabelelor de adevăr pentru ele În aproape toate cazurile, rezultatele sunt clare, cu excepția relației De Morgan, a relației de absorbție și a relației de distribuție Relația De Morgan poate fi extinsă la expresii cu mai mult de două variabile, cum ar fi ABC = A + B + C Gates și algebra booleană Orez Două funcții echivalente: AB + AC (a); A(B + C) (b) A în c A în + c A (B + C) b Tabelul - - Câteva relații ale algebrei booleene Raport ȘI SAU Relația de identitate A \u d A + A \u d A Raportul zero OD = + A = Relația de idepotență DA =A A+A=A Raportul de inversiune AĂ = A+Ă= Relația de comutativitate AB = BA A + B = B + A Raport asociativ (AB)C \u d A (BC) (A + B) + C ~ A + (B + C) Relația de distribuție A + BC = (A + B)(A + C) A(B + C) = AB + AC Raportul de absorbție A(A + B) = A A + AB = A Raportul lui De Morgan ĂB = Ă~+B Ă + ~B=ĂB Raportul lui De Morgan sugerează o notație alternativă Pe fig , iar forma AND este dată cu negație, care este prezentată folosind intrări și ieșiri inversate Astfel, o poartă SAU cu intrări inversate este echivalentă cu o poartă NAND Din fig b, care ilustrează a doua formă a relației De Morgan, este clar că în loc de o poartă NOR, se poate desena o poartă AND cu intrări inversate Prin negarea ambelor forme ale relației De Morgan, ajungem la reprezentări echivalente ale porților AND și OR (Fig , c și d) Simbol similar Capitolul Nivel logic digital Imaginile există pentru diferite forme ale relației De Morgan (de exemplu, o poartă NAND cu n intrări devine o poartă SAU cu intrări inversate) Orez Reprezentări alternative ale unor porți: NAND (a); NU-SAU (b); Si in); SAU (g) Folosind ecuațiile prezentate în fig și ecuații similare pentru porțile cu mai multe intrări, se poate converti cu ușurință suma produselor în forma numai de porți NAND sau numai de porți NOR Ca exemplu, luați în considerare funcția SAU EXCLUSIV (Fig , a) Schema standard care exprimă suma produselor este prezentată în fig b Pentru a merge la formularul NAND, trebuie să desenați linii care conectează ieșirile porților AND cu intrarea porții SAU cu intrări și ieșiri inversoare, așa cum se arată în Fig , c Orez Tabel de adevăr pentru funcția SAU EXCLUSIV (a) Trei scheme pentru calcularea acestei funcții (b), (c), (d) Circuite logice digitale de bază Apoi, pe baza fig , a, ajungem la fig , d Variabilele A și B pot fi obținute din L și B folosind porți NAND sau NOR cu intrări combinate Rețineți că intrările (ieșirile) inversoare pot fi mutate de-a lungul liniei de comunicație după bunul plac, de exemplu, de la ieșirile porților de intrare la intrările porții de ieșire Este foarte important de reținut că aceeași poartă poate calcula diferite funcții în funcție de convențiile utilizate Pe fig și am arătat semnalele de ieșire ale porții F pentru diferite combinații de semnale de intrare Atât semnalele de intrare, cât și de ieșire sunt date în volți Dacă acceptăm convenția conform căreia V este un zero logic și , V sau V este unul logic, obținem tabelul de adevăr prezentat în Fig , b, adică funcția And Un astfel de acord se numește logică pozitivă Cu toate acestea, dacă acceptăm logica negativă, adică suntem de acord că OB este o unitate logică, iar , V sau V este un zero logic, atunci vom obține tabelul de adevăr prezentat în Fig , în, adică funcția SAU A B F OV OV OV ov V OV V OV ov V V V A A B F b A la F V Orez Caracteristicile electrice ale dispozitivului (a); logica pozitiva (b); logica negativa (c) Astfel, totul depinde de ce convenție este aleasă pentru afișarea tensiunilor în mărimi logice În această carte, ne vom limita mai ales la logica pozitivă Cazurile de utilizare a logicii negative vor fi discutate separat Circuite logice digitale de bază Acum știm cum să construim cele mai simple circuite din porți individuale În practică, circuitele logice digitale sunt foarte rar construite poartă cu poartă, deși această abordare a fost cândva obișnuită Acum, blocurile standard de "construcții" sunt module care combină mai multe supape În următoarele subsecțiuni, vom analiza aceste blocuri de construcție mai detaliat și vom vedea cum sunt utilizate și cum să le obținem de la porțile individuale circuite integrate Supapele nu sunt fabricate și vândute individual, ci în module numite circuite integrate (CI) sau microcircuite circuit integrat Capitolul Nivel logic digital ma este o bucată pătrată de silicon cu dimensiunea de aproximativ x mm, pe care sunt amplasate mai multe porți Circuitele integrate mici sunt de obicei găzduite în pachete dreptunghiulare din plastic sau ceramică cu lățime de până la mm și lungime de până la mm De-a lungul laturilor lungi sunt două rânduri paralele de cabluri de aproximativ mm lungime care pot fi conectate la conectori sau lipite pe un PCB Fiecare pin este conectat la intrarea sau ieșirea unei porți, la o sursă de alimentare sau la masă Un pachet cu două rânduri de pini la exterior și circuite integrate în interior se numește oficial pachet Dual Inline Package (DIP), dar toată lumea îl numește IC, ignorând diferența dintre o bucată de siliciu și pachetul în care este plasat Majoritatea pachetelor au , , , , , , , , sau de pini Pentru microcircuite mari, se folosesc adesea pachete, în care cablurile sunt amplasate pe toate cele patru laturi sau în partea de jos Microcircuitele pot fi împărțite în mai multe clase în ceea ce privește numărul de porți pe care le conțin Această clasificare este, desigur, foarte aspră, dar uneori poate fi utilă: + MIS (circuit integrat mic) - de la la porti; + SIS (circuit integrat mediu) - de la la de porti; + LSI (circuit integrat mare) - de la la de porti; + VLSI (circuit integrat la scară foarte mare) - peste de porți Aceste circuite au proprietăți diferite și sunt utilizate în scopuri diferite MIS conține de obicei două până la șase porți independente, fiecare dintre acestea putând fi utilizată separat, așa cum este descris în secțiunile anterioare Pe fig prezintă un MIS convențional care conține patru porți NAND Orez MIS de patru porți Circuite logice digitale de bază Fiecare dintre aceste porți are două intrări și o ieșire, necesitând pini În plus, microcircuitul necesită putere (Vcc) și masă Sunt comune tuturor supapelor De obicei, există o crestătură pe carcasă lângă pinul , astfel încât să puteți identifica că este pinul Pentru a evita confuzia în diagramă, supapele neutilizate, sursa de alimentare și împământarea nu sunt afișate prin convenție Astfel de cipuri costă câțiva cenți Fiecare conține mai multe porți și până la aproximativ de pini În anii , calculatoarele au fost construite dintr-un număr mare de astfel de microcircuite, dar în prezent, o întreagă unitate centrală de procesare și o parte semnificativă a memoriei (memoria cache) sunt plasate pe un singur microcircuit Pentru comoditate, presupunem că ieșirea porții se schimbă de îndată ce semnalul de la intrarea acesteia se schimbă De fapt, există o anumită întârziere de poartă, care include timpul de trecere a semnalului prin microcircuit și timpul de comutare Întârzierea este de obicei între și ns Acum este posibil să puneți până la milioane de tranzistori pe un singur cip Deoarece orice circuit poate fi construit din porți NAND, s-ar putea avea impresia că un producător este capabil să producă un cip care conține milioane de porți NAND Din păcate, ar fi necesari de pini pentru a crea un astfel de cip Deoarece ieșirea standard este de , inchi, cipul va avea o lungime mai mare de km, ceea ce este probabil să îi afecteze negativ capacitatea de comercializare Prin urmare, pentru a profita de această tehnologie, este necesar să se dezvolte astfel de circuite în care numărul de porți depășește semnificativ numărul de pini În următoarele subsecțiuni, vom lua în considerare MMIC-urile simple în care mai multe porți sunt interconectate într-un anumit mod pentru a calcula o anumită funcție, ceea ce face posibilă reducerea numărului de ieșiri externe Scheme combinatorii Multe aplicații ale logicii digitale necesită circuite cu mai multe intrări și mai multe ieșiri în care semnalele de ieșire sunt determinate de semnalele de intrare curente O astfel de schemă se numește combinatorie Nu toate schemele au această proprietate De exemplu, un circuit care conține elemente de memorie poate genera semnale de ieșire care depind de valorile stocate în memorie Un microcircuit care implementează un tabel de adevăr (de exemplu, prezentat în Fig , a) este un exemplu tipic de circuit combinatoriu În această secțiune, vom analiza cele mai frecvent utilizate scheme combinatorii Multiplexoarele La nivel logic digital, multiplexorul este un circuit cu intrări de ", o ieșire și n linii de control care vă permit să selectați una dintre intrări Intrarea selectată este conectată la ieșire Pe fig descris Nu uita de legea lui Moore Nucleul procesorului Pentium conține deja de milioane de tranzistori și, evident, aceasta nu este limita - Notă științific ed Capitolul Nivel logic digital circuit multiplexor cu opt intrări Cele trei linii de control, A, B și C, codifică un număr de biți care specifică care dintre cele opt linii de intrare trebuie conectată la poarta SAU și, prin urmare, la ieșire Indiferent de valoarea pe liniile de control, șapte porți AND vor scoate întotdeauna , iar cea rămasă poate scoate sau , în funcție de valoarea liniei de intrare selectate Fiecare poartă AND este declanșată de o combinație specifică de semnale pe liniile de control Dacă circuitul multiplexor prezentat în Fig , adăugați o sursă de alimentare și împământare, apoi multiplexorul poate fi inclus într-un pachet cu pini Orez RĂU Diagrama multiplexorului cu opt intrări Folosind un multiplexor, putem implementa funcția majoritară (vezi Figura a) așa cum se arată în Figura b Pentru fiecare combinație de A, B și C, se selectează una dintre liniile de intrare Fiecare intrare este conectată fie la Vcc ( logic), fie la masă ( logic) Algoritmul conexiunii de intrare este foarte simplu: intrarea D este aceeași cu valoarea din rândul i al tabelului de adevăr Pe fig , iar în liniile , , și valoarea funcției este , deci intrările corespunzătoare sunt împământate; în rândurile rămase, valoarea funcției este , deci intrările corespunzătoare sunt conectate la una logică În acest fel, orice tabel de adevăr cu trei variabile poate fi implementat folosind cipul din Fig , a Circuite logice digitale de bază Vcc Do Di D D D d D D F Do Di D D D d D D F A B C A B C A Orez Multiplexor construit pe SIS (a); același multiplexor montat pentru a calcula funcția majoritară (b) Am văzut deja cum poate fi folosit un multiplexor pentru a selecta una dintre mai multe intrări și cum permite construirea unui tabel de adevăr Poate fi folosit și ca convertor paralel cu serial Dacă aplicați biți de date liniilor de intrare și apoi comutați alternativ liniile de control pentru a obține valori de la OOO la (acestea sunt numere binare), atunci biți vor merge la linia de ieșire în serie În mod obișnuit, această conversie se realizează la introducerea informațiilor de la tastatură, deoarece fiecare apăsare de tastă determină un număr de sau biți care ar trebui transmis secvenţial prin linia telefonică Opusul unui multiplexor este un demultiplexor, care conectează un singur semnal de intrare la una dintre cele ieșiri, în funcție de valorile semnalelor din cele n linii de control Dacă valoarea binară a liniilor de control este k, atunci ieșirea k este selectată Decodoare Ca un al doilea exemplu, luați în considerare un circuit care ia un număr de n biți ca intrare și îl folosește pentru a selecta (adică, setat la ) una dintre liniile de ieșire de " Un astfel de circuit se numește decodor Un exemplu de decodor pentru n = este prezentat în fig Pentru a înțelege de ce este nevoie de un decodor, imaginați-vă o memorie formată din cipuri, fiecare conținând MB Cipul are adrese de la la MB, cipul are adrese de la MB la MB și așa mai departe Cei mai importanți trei biți ai adresei sunt utilizați pentru a selecta unul dintre cele opt cipuri Pe fig , acești trei biți sunt cei trei intrări L, B și C În funcție de semnalele de intrare, exact una dintre cele opt linii de ieșire (£) , , D ) ia valoarea G, liniile rămase iau valoarea valoarea Fiecare linie de ieșire declanșează una Capitolul Nivel logic digital de opt cipuri de memorie Deoarece o singură linie este setată la , este pornit un singur cip Orez Diagrama unui decodor care conține intrări și ieșiri Principiul de funcționare al circuitului prezentat în Fig nu este dificil Fiecare poartă AND are trei intrări, dintre care prima este A sau L, a doua este B sau B, a treia este C sau C Fiecare poartă este declanșată de o combinație diferită de intrări: Dq - combinație de A B C, Dx - combinație de A B C și t d Comparatoare Un alt circuit util este comparatorul Comparatorul compară două cuvinte care sunt introduse Comparatorul prezentat în fig ia două intrări, L și B, câte biți fiecare, și iese dacă sunt egale și dacă nu sunt egale Circuitul se bazează pe o poartă EXCLUSIVĂ SAU care scoate dacă intrările sunt egale și dacă intrările nu sunt egale Dacă toate cele patru cuvinte de intrare sunt egale, toate cele patru porți SAU EXCLUSIVE ar trebui să iasă Aceste patru semnale sunt apoi introduse în poarta SAU Dacă rezultatul este , atunci cuvintele de intrare sunt egale; altfel nu sunt egali În exemplul nostru, am folosit o poartă OR ca finală pentru a schimba valoarea rezultatului: înseamnă egal, înseamnă inegalitate Circuite logice digitale de bază Orez Comparator simplu pe biți Matrici logice programabile Sa observat mai devreme că orice funcție (tabelul de adevăr) poate fi reprezentată ca o sumă de produse și, prin urmare, întruchipată într-un circuit folosind porți AND și SAU Așa-numita matrice logică programabilă este utilizată pentru a calcula sumele produselor (Fig ) Acest cip conține intrări pentru variabile Semnale suplimentare (inversări) sunt generate în interiorul microcircuitului însuși Rezultatul este un total de de semnale de intrare Ce semnal de intrare intră într-o anumită poartă AND este determinat de o matrice de x de biți Fiecare dintre liniile de intrare către porțile AND conține o legătură sigură La ieșirea din fabrică, toate cele de jumperi rămân intacte Pentru a programa matricea, clientul arde jumperii selectați prin aplicarea unei tensiuni ridicate la circuit Partea de ieșire a circuitului constă din șase porți SAU, fiecare conținând până la de intrări, ceea ce corespunde prezenței a de ieșiri pentru porțile AND Care dintre conexiunile potențiale există de fapt depinde de modul în care a fost programată matricea de x Microcircuitul are pini de intrare, pini de ieșire, putere și masă (adică de pini în total) Să dăm un exemplu de utilizare a unei matrice logică programabilă Să revenim la diagrama din fig b Conține trei intrări, patru porți AND, o poartă SAU și trei invertoare Dacă ne programăm matricea într-un anumit mod, aceasta poate calcula aceeași funcție folosind trei dintre cele intrări, patru dintre cele de porți AND și una dintre porțile SAU (Cele patru porți AND trebuie să calculeze produsele ABC, ABC, ABC și ABC; poarta SAU preia aceste produse ca intrare ) Puteți avea aceeași matrice logică programabilă să calculeze suma în același timp Capitolul Nivel logic digital patru funcții de aceeași complexitate Pentru funcțiile simple, factorul limitativ este numărul de variabile de intrare, pentru cele mai complexe, porțile AND și SAU Dacă acest jumper se arde, atunci semnalul de la supapa nu ajunge la supapa ieșiri Orez Matrice logica programabila cu intrari si iesiri Pătratele mici sunt legături fuzibile care sunt arse pentru a obține funcția dorită Siguranțele sunt ordonate în două matrice, matricea superioară este pentru porțile AND, cea inferioară este pentru porțile SAU Deși matricele programabile în câmp sunt încă utilizate, sunt preferate matricele personalizate Sunt dezvoltate de client și produse de producător în conformitate cu cerințele clientului Astfel de matrice logice programabile sunt mult mai ieftine Circuite logice digitale de bază Acum putem discuta trei moduri diferite de a implementa tabelul de adevăr prezentat în Fig , a Dacă folosim ca componente MIS, avem nevoie de microcircuite Pe de altă parte, ne putem descurca cu un singur multiplexor bazat pe SIS, așa cum se arată în Fig b În cele din urmă, putem folosi doar un sfert din matricea logică programabilă Evident, dacă trebuie calculate multe funcții, utilizarea unei matrice logică programabilă este mai eficientă decât utilizarea celorlalte două metode Pentru circuite simple, sunt de preferat MIS și SIS mai ieftine Scheme aritmetice Să trecem de la SIS de uz general la scheme SIS combinatorii care sunt utilizate pentru a efectua operații aritmetice Vom începe cu un simplu shifter de biți, apoi ne uităm la structura sumătorilor și, în final, vom privi unitățile logice aritmetice, care joacă un rol esențial în orice computer Scheme de forfecare Primul circuit aritmetic al SIS, pe care îl vom lua în considerare, va fi un circuit cu deplasare care conține intrări și ieșiri (Fig ) Opt biți de intrare sunt introduși în liniile Do,Dy Datele de ieșire, care sunt datele de intrare deplasate cu bit, sunt primite pe linia , Sy Linia de control C determină direcția de schimbare: - la stânga, - la dreapta Orez Schema de schimburi Pentru a înțelege cum funcționează un astfel de circuit, luați în considerare perechile de porți AND (cu excepția celor extreme) Dacă C = , membrul drept al fiecărei perechi este pornit, trecând bitul corespunzător prin el însuși Deoarece poarta dreaptă AND este conectată la intrare Capitolul Nivel logic digital poarta SAU, care este situată în dreapta acestei porți ȘI, este deplasată la dreapta Dacă C \u d , poarta ȘI stânga a perechii este activată, apoi are loc o deplasare la stânga Aditivi Un computer care nu poate adăuga numere întregi este practic de neconceput Prin urmare, circuitul pentru efectuarea operațiilor de adăugare este o parte esențială a oricărui procesor Tabelul de adevăr pentru adăugarea numerelor întregi cu o singură cifră este prezentat în fig , a Există două rezultate aici: suma variabilelor de intrare L și B și un transfer la următoarea poziție (stânga) Circuitul de calcul al bitului de sumă și al bitului de transport este prezentat în fig b Un astfel de circuit este de obicei numit semi-adunator A B Transfer de sumă Exclusiv-sau poarta Transfer Orez Tabel de adevăr pentru adăugarea numerelor dintr-o singură cifră (a); jumatate de circuit sumator ( ) Jumătatea de adunare este potrivită pentru adăugarea biților inferiori ai două cuvinte cu mai mulți biți Cu toate acestea, nu este potrivit pentru adăugarea de biți în mijlocul unui cuvânt, deoarece nu poate fi transportat în acea poziție Prin urmare, este necesar un adunator complet (Fig ) Ar trebui să fie clar din diagramă că un sumator complet este format din două jumătăți de sumatori Suma este dacă există un număr impar de variabile A, B și intrarea de transfer este (adică dacă una dintre variabile sau toate trei este egală cu una) Ieșirea de transport este dacă fie A și B sunt ambele (intrarea din stânga la poarta SAU) sau unul dintre ei este și intrarea de transport este, de asemenea, Cele două jumătăți de adunare produc atât biți de sumă, cât și biți de transport Pentru a construi un sumator, de exemplu, pentru două cuvinte de biți, trebuie să duplicați circuitul prezentat în Fig ori b Transferul se face către bitul adiacent stâng Un transfer la bitul din dreapta este conectat la Un astfel de sumator se numește un sumător de transfer Adăugarea de la la nu va avea loc până când transportul nu va trece de la bitul din dreapta la cel din stânga Există agregatoare mai rapide care funcționează fără această întârziere Desigur, li se acordă preferință Circuite logice digitale de bază A in Transfer In Sum Transfer Out Intrare transfer a b Orez Tabelul de adevăr pentru sumatorul complet (a); circuit pentru un sumator complet (b) Luați în considerare un exemplu de adăugare mai rapidă Să împărțim sumatorul pe de biți în jumătăți: cel de jos pe biți și cel de sus pe biți Când începe adăugarea, sumatorul superior nu poate începe încă să funcționeze, deoarece nu cunoaște valoarea transportului și nu va putea afla până când nu se fac însumări în sumatorul inferior Cu toate acestea, se poate face o singură transformare În loc de un vizor superior, puteți obține două sumătoare superioare prin duplicarea părții corespunzătoare a echipamentului Apoi circuitul va fi format din trei sumatoare pe biți: unul inferior și două superioare, Uo și Ulf lucrând în paralel Ca transport, intră în sumatorul Uo, iar intră în sumator Ambele sumatoare superioare încep să lucreze simultan cu sumatorul inferior, dar numai unul dintre rezultatele însumării celor doi sumatori superioare va fi corect După adăugarea celor cifre inferioare, valoarea transferului către suma superioară devine cunoscută, iar apoi poate fi determinat răspunsul corect Cu această abordare, timpul de adăugare se reduce la jumătate Un astfel de adunator este numit un adunator carry-select Puteți împărți din nou fiecare sumator pe biți în două sumătoare pe biți și așa mai departe Unități aritmetice logice Majoritatea calculatoarelor conțin un singur circuit pentru efectuarea operațiilor AND, SAU și adunare pe două cuvinte mașină De obicei, acest circuit pentru cuvinte pe n biți constă din n circuite identice, câte unul pentru fiecare poziție de bit Figura prezintă o astfel de schemă, care se numește aritme- Capitolul Nivel logic digital unitate tico-logică (ALU) Acest dispozitiv poate calcula una dintre următoarele funcții: A AND B, L SAU B, B sau A + B Alegerea funcției depinde de ce semnale sunt recepționate pe liniile Fo și Ff , , sau AND (în sistem de numere binar) Rețineți că aici A + B înseamnă suma aritmetică a lui L și B și nu operația logică AND Ieșire transfer Orez Un singur bit ALU În colțul din stânga jos al circuitului este un decodor pe doi biți care generează semnale de pornire pentru patru operațiuni Alegerea funcționării este determinată de semnalele de control Fo și În funcție de valorile Fo și Fx, se selectează una dintre cele patru linii de activare, iar apoi semnalul de ieșire al funcției selectate trece prin ultima poartă SAU În colțul din stânga sus al diagramei este un dispozitiv logic pentru calcularea funcțiilor L AND V, L OR V și V, dar numai unul dintre aceste rezultate trece prin ultima poartă SAU, în funcție de care dintre liniile de activare are decodorul ales Deoarece exact unul dintre semnalele de ieșire ale decodorului poate Circuite logice digitale de bază fie egal cu , atunci exact una dintre cele patru porți AND va începe Cele trei porți rămase vor scoate indiferent de valorile lui A și B ALU poate efectua nu numai operații logice și aritmetice asupra variabilelor A și B, ci și să le facă egale cu zero prin anularea ENA (enable signal A) sau ENB (enable signal B) De asemenea, puteți obține A setând semnalul INVA (inversează A) Vom vedea de ce sunt necesare ENA, ENB și INVA în Capitolul În condiții normale, atât ENA cât și ENB sunt pentru a permite ambele intrări, iar INVA este În acest caz, A și B merg pur și simplu la unitatea logică fara modificari În colțul din dreapta jos este o sumătoare completă pentru calcularea sumei lui A și B, precum și pentru efectuarea transferurilor Semnificațiile sunt necesare deoarece mai multe astfel de circuite pot fi conectate pentru a efectua operații pe cuvinte întregi Circuite cu un singur bit precum cel prezentat în Fig sunt numite secțiuni de microprocesor de biți Acestea permit dezvoltatorului să construiască un ALU de orice capacitate Pe fig prezintă o diagramă a unei ALU pe biți, compusă din opt secțiuni pe un singur bit Semnalul INC (incrementare cu unu) este necesar doar pentru operațiuni de adăugare Face posibilă calcularea unor sume precum A + și A + B + fi transfer transfer Orez Opt secțiuni cu un singur bit conectate pentru a forma un ALU de biți Pentru a simplifica circuitul, semnalele de activare și inversare nu sunt afișate Generatoare de ceas În multe circuite digitale, totul depinde de ordinea operațiilor Uneori o operație trebuie să precedă alta, alteori două operații trebuie să aibă loc în același timp Pentru a controla parametrii de sincronizare, generatoarele de ceas sunt încorporate în circuitele digitale pentru a asigura sincronizarea Un generator de ceas este un circuit care provoacă o serie de impulsuri Toate impulsurile au aceeași durată Intervalele dintre impulsurile succesive sunt de asemenea aceleași Intervalul de timp dintre începutul unui impuls și începutul următorului se numește timp takt Frecvența pulsului este de obicei între și MHz, ceea ce corespunde unui ciclu de ceas de până la ns Frecvența oscilatorului ceasului este de obicei controlată de un oscilator cu cristal pentru a obține o precizie ridicată Capitolul Nivel logic digital Multe lucruri se pot întâmpla într-un computer în timpul unui ciclu Dacă urmează să fie efectuate într-o anumită ordine, atunci măsura ar trebui împărțită în subcicluri Pentru a obține o rezoluție mai bună decât ceasul principal, trebuie să ramificați linia principală a ceasului și să introduceți un circuit cu un anumit timp de întârziere Așa se generează semnalul secundar al generatorului de ceas, decalat în fază față de cel primar (Fig , a) Diagrama de timp prezentată în fig , b, oferă patru puncte de origine pentru evenimente discrete: Față Refuza miercuri Fata C Recesiune C Prin asocierea diferitelor evenimente cu diferite scăderi (fronturi și recesiuni), puteți realiza succesiunea dorită de acțiuni Dacă sunt necesare mai mult de patru puncte de referință într-un ciclu, mai multe ramuri de la linia principală pot fi făcute cu timpi de întârziere diferiți Orez Generator de ceas (a); diagrama de timp a generatorului de ceas (b); generarea de impulsuri de ceas asincrone (c) În unele circuite, intervalele de timp sunt importante, nu timpii discreti De exemplu, un eveniment poate apărea nu în partea din față a pulsului, ci în orice moment când nivelul pulsului C\ este ridicat Un alt eveniment poate apărea numai atunci când nivelul pulsului C este ridicat Dacă sunt necesare mai mult de două intervale, furnizați mai multe linii de ceas sau faceți ca stările de puls ridicat ale celor două ceasuri să se suprapună parțial în timpul Memorie timp În acest din urmă caz se pot distinge intervale separate: Q AND C , Cj AND C , AND C și AND C Generatoarele de ceas pot fi sincrone În acest caz, durata de viață a unui impuls de nivel înalt este egală cu durata de viață a unui impuls de nivel scăzut (vezi Fig , b) Pentru a obține un tren asincron de impulsuri (a se vedea semnalul C în Fig , c), trebuie să deplasați semnalul oscilatorului principal folosind un circuit de întârziere Apoi trebuie să conectați semnalul recepționat cu semnalul original folosind funcția logică AND Memorie Memoria este o componentă necesară a oricărui computer Fără memorie, nu ar exista computere, cel puțin nu cele pe care le avem acum Memoria este folosită pentru a stoca atât instrucțiuni, cât și date În următoarele subsecțiuni, ne vom uita la principalele componente ale memoriei, începând de la nivelul porții Vom vedea cum funcționează, cum pot fi folosite pentru a construi memorie de mare capacitate Încuietori Pentru a crea un bit de memorie, aveți nevoie de un circuit care cumva "își amintește" valorile anterioare de intrare Un astfel de circuit poate fi construit din două porți NOR, așa cum se arată în Fig a Circuite similare pot fi construite din porți NAND Nu vom menționa aceste circuite în continuare, deoarece sunt în esență identice cu circuitele cu porți NOR Orez zăvor NOR în starea (a); zăvor NOR în starea (b); tabel de adevăr pentru funcția NOR (c) Schema prezentată în fig , a, se numește zăvor SR Are două intrări: S (Setare - setări R (Resetare - resetare) Are și două ieșiri complementare: Q și Q Spre deosebire de circuitul combinatoriu, semnalele de ieșire ale latch-ului nu sunt determinate de semnalele de intrare curente Pentru a înțelege cum funcționează zăvorul, să presupunem că S = și R = (în general, semnalul la aceste intrări este de cele mai multe ori) Să presupunem de asemenea că ( = Deoarece Q revine la poarta NOR de sus și ambele intrări ale acesteia Capitolul Nivel logic digital porțile sunt , apoi ieșirea sa, Q, este Una se întoarce la poarta de jos, care se termină cu o intrare , cealaltă , iar ieșirea este = Această stare de lucruri este cel puțin consistentă (vezi Fig , a) Acum să ne imaginăm că Q = și R și S sunt încă Poarta de sus are intrări și și o ieșire Q (adică ) care merge înapoi la poarta de jos Această stare de fapt, prezentată în fig b este de asemenea consecvent Situația în care ambele ieșiri sunt nu este valabilă, deoarece în acest caz ambele porți ar avea două zerouri la intrare, ceea ce ar duce la unul la ieșire, nu zero În mod similar, nu este posibil să avem ambele ieșiri egale cu , deoarece asta ar avea ca rezultat ca ambele intrări să fie și , ceea ce face ca rezultatul să fie , nu Derivarea noastră este simplă: la ? = S = zăvorul are două stări stabile, pe care le vom numi și în funcție de Q Acum să luăm în considerare efectul semnalelor de intrare asupra stării latch-ului Să presupunem că S ia valoarea în timp ce Q = Atunci intrările la poarta superioară sunt atât , cât și , ducând la o ieșire de = Această modificare face ca ambele intrări către poarta de jos să fie egale cu și, prin urmare, ieșirea este Astfel, setarea S la comută starea de la la Setarea R la când zăvorul este în starea nu provoacă modificări deoarece ieșirea porții NOR de jos este pentru ambele intrări și AND Folosind acest argument, este ușor de observat că setarea S la cu starea de blocare (adică, Q = ) nu provoacă nicio modificare, dar setarea R la determină schimbarea stării de blocare Astfel, dacă S este , atunci este egal cu , indiferent de starea anterioară a zăvorului În mod similar, schimbarea R la determină Q = Circuitul "îți amintește" dacă ultimul semnal a fost S sau R Folosind această proprietate, putem construi memoria computerului Încuietori SR sincron Este adesea convenabil să aveți o stare de schimbare a zăvorului numai la anumite momente Pentru a atinge acest obiectiv, vom schimba ușor circuitul principal și vom obține un blocaj SR sincron (Figura ) generator de ceas Orez Încuietoare SR sincronă Acest circuit are o intrare suplimentară de ceas, care este în mare parte Dacă această intrare este , atunci ambele ieșiri ale porților AND sunt și, indiferent de valorile lui S și R, zăvorul nu își schimbă starea Când Memorie Când intrarea ceasului este setată la , porțile AND sunt dezactivate, iar zăvorul devine dependent de și Termenii turn-on și gating sunt adesea folosiți pentru a indica faptul că o intrare de ceas este una Până acum, nu ne-am dat seama ce se întâmplă când S = R = Și din motive evidente: când ambii și revin în cele din urmă la , circuitul devine nedeterminist Singura stare acceptabilă la = = este Q = Q = , dar de îndată ce ambele intrări revin la , zăvorul trebuie să intre în una dintre cele două stări stabile Dacă una dintre intrări merge la înaintea celeilalte, cea care rămâne în starea "câștigă" deoarece este singura intrare care controlează starea latch-ului Dacă ambele intrări merg la în același timp (ceea ce este foarte puțin probabil), latch-ul alege una dintre stările sale stabile aleatoriu Încuietori D sincron Pentru a rezolva situația cu incertitudinea SR-latch (incertitudinea apare dacă S = = ), trebuie să preveniți apariția acesteia Pe fig Figura prezintă un circuit de blocare cu o singură intrare D Deoarece intrarea către poarta AND de jos este întotdeauna inversa intrării către poarta AND de sus, situația în care ambele intrări sunt nu apare niciodată Când D = și intrarea ceasului este , blocarea trece în starea Q = Când D = și intrarea ceasului este , blocarea trece în starea Q = Cu alte cuvinte, când intrarea ceasului este , valoarea curentă a lui D este eșantionată și stocată într-un dispozitiv de blocare Acest circuit, numit D-latch sincron, este o memorie de bit Valoarea stocată este întotdeauna disponibilă la ieșirea Q Pentru a încărca valoarea curentă a lui D în memorie, trebuie aplicat un impuls pozitiv liniei de semnal de ceas Un astfel de circuit necesită tranzistori AND Circuitele mai complexe (care sunt cele utilizate în mod obișnuit în practică) pot stoca bit pe doar tranzistoare declanșatoare Multe circuite, dacă este necesar, selectează o valoare pe o anumită linie la un moment dat în timp și o amintesc Într-o astfel de schemă, care se numește flip-flop, o schimbare de stare nu are loc la sincronizare Capitolul Nivel logic digital semnalul este , iar când semnalul ceasului se schimbă de la la (margine) sau de la la (în scădere) Prin urmare, lungimea pulsului de ceas nu contează, deoarece tranzițiile sunt rapide Să subliniem din nou diferența dintre un flip-flop și un zăvor Declanșatorul este declanșat de margine, iar zăvorul este declanșat de nivel Rețineți că acești termeni sunt adesea confuzi în literatură Mulți autori folosesc termenul "flip-flop" atunci când se referă la un zăvor și invers Există mai multe abordări pentru dezvoltarea declanșatorilor De exemplu, dacă ar exista o modalitate de a genera un impuls foarte scurt la marginea ascendentă a semnalului de ceas, acel impuls ar putea fi aplicat la D-latch-ul De fapt, există o astfel de cale Circuitul corespunzător este prezentat în Fig , a d buc A Cu b A Timp b Orez Generator de impulsuri (a); diagramă de timp pentru patru puncte din diagrama (b) La prima vedere, poate părea că ieșirea porții AND va fi întotdeauna zero, deoarece funcția AND a oricărui semnal cu inversarea sa dă , dar în realitate situația este ceva mai complicată Când semnalul trece prin invertor, există o întârziere mică, dar nu zero Această schemă funcționează tocmai din cauza acestei întârzieri Să presupunem că măsurăm tensiunea în patru puncte: a, b, c și d Semnalul de intrare la punctul a este un impuls lung de ceas (graficul inferior din Figura b) Semnalul din punctul b este afișat deasupra acestuia Rețineți că acest semnal este inversat și este alimentat În literatura internă, termenul "latch" (latch) nu este folosit deloc, se vorbește despre declanșatoare Cu toate acestea, aceasta introduce conceptul de declanșare T, care este declanșatorul "adevărat" - Notă științific ed Memorie cu oarecare întârziere Timpul de întârziere depinde de tipul de invertor și este de obicei de câteva nanosecunde Semnalul de la punctul c este de asemenea întârziat, dar această întârziere se datorează doar timpului necesar semnalului pentru a călători (la viteza luminii) Dacă distanța fizică dintre punctele a și c este, de exemplu, de de microni, atunci întârzierea de propagare a semnalului este de , ns, ceea ce este desigur neglijabil în comparație cu timpul de călătorie a semnalului prin invertor Astfel, semnalul din punctul c este aproape identic cu semnalul din punctul a Când semnalele de intrare bis sunt AND, rezultatul este un impuls scurt a cărui lungime (A) este egală cu întârzierea porții a invertorului (de obicei ns sau mai puțin) Semnalul de ieșire al porții AND este un impuls dat, deplasat din cauza întârzierii porții AND (graficul de sus din Fig , b) Această decalare a timpului înseamnă doar că D-latch-ul este activat cu o anumită întârziere după frontul ascendent al pulsului de ceas Nu afectează în niciun fel lungimea pulsului Într-o memorie cu un timp de ciclu de ns, impulsul de ns (care spune când să selecteze linia D) este suficient de scurt, caz în care circuitul complet ar putea fi ca în Fig Trebuie menționat faptul că o astfel de schemă de declanșare este ușor de înțeles, dar de obicei declanșatoarele mai complexe sunt utilizate în practică Denumirile standard pentru zăvoare și flip-flops sunt prezentate în fig Pe fig a prezintă un zăvor a cărui stare este încărcată atunci când semnalul de ceas CK (din cuvântul ceas) este , spre deosebire de zăvorul prezentat în fig b, al cărui semnal de ceas este în mod normal , dar merge la pentru a încărca starea din linia D În fig , c și d arată declanșatorii Faptul că acestea sunt flip-flops, nu zăvoare, este indicat de un colț pe intrarea de sincronizare Declanșatorul din fig , schimbă starea din fața pulsului de ceas (tranziție de la la ), în timp ce declanșatorul din fig , r schimbă starea în declin (tranziție de la la ) Multe (deși nu toate) zăvoare și flip-flop au, de asemenea, o ieșire Q, iar unele au două intrări suplimentare: Set (set) sau Preset (preset) și Reset (resetare) sau Cieag (clear) Prima intrare (Setare sau Presetare) setează Q = , iar a doua (Resetare sau Clear) setează Q = Capitolul Nivel logic digital DQ DQ DQ DQ SC SC >SC SC A b V Orez Încuietori D și șlapi D Registrele Există diverse configurații de declanșare Pe fig a prezintă un circuit care conține două flip-flops D independente cu semnale prestabilite și clare Deși aceste două flip-flop sunt pe același cip cu pini, nu sunt conectate Declanșatorul "de opt ori" prezentat în Fig b Aici, spre deosebire de circuitul anterior, opt flip-flop nu au o ieșire Q și linii presetate, iar toate liniile de ceas sunt conectate împreună și controlate de pinul I Flip-flops-urile în sine sunt de același tip ca în fig , d, dar intrările inversoare sunt anulate de invertorul asociat pinului AND, astfel încât flip-flops-urile sunt declanșate la o tranziție de la la Toate cele opt semnale clare sunt de asemenea combinate, deci atunci când pinul trece în starea , toate bistabilele trec în starea Dacă nu este clar de ce pinul este inversat la intrare și apoi inversat din nou cu fiecare semnal SC, răspunsul este simplu: semnalul de intrare nu are suficientă putere pentru a declanșa toate cele opt papuci flip-flop; invertorul de intrare este de fapt folosit ca amplificator Unul dintre motivele pentru combinarea liniilor de sincronizare și a liniilor clare în microcircuitul din Fig , b - economia concluziilor În același timp, microcircuitul acestei configurații este oarecum diferit de cele opt flip-flop fără legătură și este folosit ca un registru de biți Două astfel de microcircuite pot funcționa în paralel, formând un registru de biți Pentru a face acest lucru, trebuie să legați concluziile corespunzătoare și I Vom lua în considerare registrele și aplicarea lor mai detaliat în Capitolul Organizarea memoriei Deși am făcut tranziția de la o memorie simplă de biți (vezi Figura ) la o memorie de biți (vezi Figura b), construirea unei memorie mari necesită un mod diferit de organizare, în care puteți accesa cuvinte individuale Un exemplu de organizare a memoriei care satisface acest criteriu este prezentat în Fig Această memorie conține patru cuvinte de biți Fiecare operație citește sau scrie un întreg cuvânt de biți Deși cantitatea totală de memorie ( biți) nu este cu mult mai mare decât cea a unui flip-flop de biți, aceasta Memorie Ce memorie necesită mai puțini pini și, cel mai important, o astfel de organizare este aplicabilă pentru construirea unei memorie mari A Orez Declanșator dublu D (a), declanșator "opt" (b) Capitolul Nivel logic digital OE DQ DQ DQ Cuvântul O ->SK >SK >SK Cuvântul Cuvântul Cuvântul CS RD Scrie Poarta Linia de eșantionare a cuvântului O Ai Aq Date de intrare h - DQ DQ- DQ- >SK ->SK ->SK DQI D SP >SK Oi O Oz Rezoluție de ieșire = CS • RD • OE Orez Diagrama bloc logica pentru memorie x Fiecare rând reprezintă unul dintre cuvintele de biți Când citiți și scrieți, un cuvânt întreg este întotdeauna citit sau scris Exemplu de cuvânt rândul Exemplu de cuvânt rândul CS-RD DQ DQ F*SK ■>SK >SK DQ- -|DQ-] ■>ck ->sk Deși organizarea memoriei prezentată în Fig poate părea complicat la prima vedere, dar este de fapt foarte simplu datorită structurii sale regulate Microcircuitul conține linii de intrare, în special intrări pentru date - Io, Ii și I ; intrari pentru adrese - Ao si At; intrări pentru control - CS (Chip Select - selectarea unui element de memorie), RD (ReaD - citire, acest semnal vă permite să distingeți citirea de scriere) și OE (Output Enable - permisiunea de a emite semnale de ieșire), precum și linii de ieșire pentru date - O , Ot și O O astfel de memorie poate fi plasată în principiu într-un pachet cu pini (inclusiv putere și masă), iar un flip-flop de biți necesită de pini Memorie Pentru a selecta un cip de memorie, logica externă trebuie să seteze semnalul CS la și, de asemenea, să seteze semnalul RD la pentru citire și pentru scriere Cele două linii de adresă trebuie să indice care dintre cele patru cuvinte de biți urmează să fie citit sau scris La citire, liniile de introducere a datelor nu sunt utilizate Un cuvânt este selectat și plasat pe liniile de ieșire a datelor La scriere, biții de pe liniile de intrare de date sunt încărcați în cuvântul de memorie selectat; liniile de ieșire nu sunt utilizate Acum să vedem cum memoria prezentată în Fig Cele patru porti SI pentru selectarea cuvintelor din partea stanga a circuitului formeaza un decodor Invertoarele de intrare sunt aranjate astfel încât fiecare poartă să fie condusă de o anumită adresă Fiecare poartă conduce o linie de selecție a cuvintelor (pentru cuvintele , , și ) Când cipul este pe cale să scrie, linia verticală CSRD este setată la , activând una dintre cele patru porți de scriere Alegerea porții depinde de ce linie de selectare a cuvântului este Ieșirea porții de scriere conduce toate semnalele CK pentru cuvântul selectat, încărcând datele de intrare în flip-flop pentru acel cuvânt Se face o scriere numai dacă semnalul CS este și RD este și se scrie doar cuvântul selectat de adresele Ao și At; restul cuvintelor nu se schimbă Procesul de citire este similar cu cel de scriere Decodificarea adreselor are loc exact în același mod ca atunci când scrieți Dar, în acest caz, linia CSRD este setată la , deci toate porțile de scriere sunt dezactivate și niciunul dintre flip-flops nu se schimbă În schimb, linia de selectare a cuvântului declanșează porțile AND asociate cu biții Q ai cuvântului selectat Astfel, cuvântul selectat își alimentează datele la porțile SAU cu intrări situate în partea de jos a circuitului, iar celelalte trei cuvinte ies Prin urmare, ieșirea porților SAU este identică cu valoarea stocată în acel cuvânt Cele trei cuvinte rămase nu afectează în niciun fel rezultatul Am putea proiecta un circuit în care trei porți SAU să fie conectate la trei linii de ieșire de date, dar acest lucru ar cauza unele probleme Am tratat liniile de intrare a datelor și liniile de ieșire a datelor ca linii diferite În practică, se folosesc aceleași linii Dacă am conecta porțile SAU la liniile de ieșire a datelor, cipul ar încerca să scoată date (adică să seteze fiecare linie la o anumită valoare) chiar și în timpul procesului de scriere, interferând cu intrarea normală a datelor Din acest motiv, este de dorit să conectați cumva porțile SAU la liniile de ieșire a datelor atunci când citiți și să le deconectați complet când scrieți Tot ce avem nevoie este un comutator electronic care se poate conecta și deconecta în câteva nanosecunde Din fericire, astfel de comutatoare există Pe fig , este prezentată o imagine simbolică a așa-numitului element tampon fără inversare Conține o linie de intrare a datelor, o linie de ieșire a datelor și o linie de intrare de control Când intrarea de control este , elementul tampon acţionează ca un conductor (Fig b) Când intrarea de control este , elementul tampon acționează ca un izolator (Figura c), ca și cum cineva ar tăia ieșirea de date din restul circuitului cu tăietori de sârmă Conexiunea poate fi restabilită în câteva nanosecunde setând semnalul de control la Capitolul Nivel logic digital Intrare ieșire Control a B C D Orez Element tampon fără inversare (a); reprezentarea elementului tampon fără inversare când semnalul de control este (b); reprezentarea elementului tampon fără inversare când semnalul de control este (c); element tampon cu inversare (r) Pe fig Figura d prezintă un element tampon inversat care acționează ca un invertor convențional când semnalul de control este și separă ieșirea de restul circuitului când semnalul de control este Ambele elemente tampon sunt dispozitive cu trei stări, deoarece pot ieși un semnal zero , un singur semnal sau niciun semnal (caz cu circuit deschis) Elementele tampon amplifică, de asemenea, semnalele, astfel încât să poată gestiona mai multe semnale în același timp Uneori sunt folosite în circuite ca amplificatoare Până acum, ar trebui să vă fie clar de ce aveți nevoie de trei elemente tampon fără inversare pe liniile de ieșire a datelor Când semnalele CS, RD și OE sunt , semnalul de activare a ieșirii este, de asemenea, , ca urmare, elementele tampon sunt declanșate și un cuvânt este plasat pe liniile de ieșire Când unul dintre semnalele CS, RD și OE este , ieșirile sunt deconectate de la restul circuitului Cip-uri de memorie Avantajul memoriei prezentate în Fig este că o astfel de structură este aplicabilă în dezvoltarea memoriei mari Figura prezintă un circuit x (pentru patru cuvinte a câte biți fiecare) Pentru a-l extinde la x , trebuie să adăugați încă coloane de declanșare cu câte declanșatori fiecare, precum și linii de intrare și de ieșire Pentru a trece de la un model x la un model x , trebuie să adăugați încă patru rânduri de flip-flops cu trei flip-flops fiecare, precum și o linie de adresă Ar Cu această structură, numărul de cuvinte din memorie trebuie să fie o putere de doi pentru o eficiență maximă, iar numărul de biți dintr-un cuvânt poate fi orice Tehnologia de fabricație a circuitelor integrate se potrivește perfect cu structura obișnuită a cipurilor de memorie Pe măsură ce tehnologia avansează, numărul de biți care se pot potrivi pe un singur cip crește constant, dublându-se de obicei la fiecare luni (legea lui Moore) Odată cu apariția cipurilor mari, cipurile mici nu devin întotdeauna imediat învechite, deoarece există întotdeauna un compromis între capacitate, viteză, putere, preț și ușurința de interfață De obicei, cele mai mari cipuri moderne sunt la mare căutare și, prin urmare, costă mult mai mult pe bit decât cipurile mici Memorie Cu orice cantitate de memorie, există mai multe opțiuni pentru organizarea microcircuitului Pe fig Figura prezintă două structuri posibile pentru un cip de Mb: K x și K x (dimensiunile cipurilor de memorie sunt de obicei date în biți, nu în octeți, așa că vom rămâne la această convenție aici) Pe fig , dar puteți vedea linii de adresă pentru accesarea unuia dintre cei de octeți și linii de date pentru încărcarea sau stocarea octetului selectat A Orez Două moduri de organizare a memoriei de Mb b Să facem o mică remarcă despre terminologie La unele terminale, tensiunea ridicată provoacă unele acțiuni, la altele, tensiunea scăzută rămâne Pentru a evita confuzia, vom folosi termenul de semnal set atunci când este apelată o acțiune, în loc să spunem că tensiunea crește sau scade Astfel, pentru unele iesiri, setarea semnalului inseamna setarea unitatii, pentru altele, setarea semnalului la zero Numele PIN care sunt setate la au o supralinie Adică semnalul CS este unul, semnalul CS este zero Termenul opus este aruncarea Și acum înapoi la microcircuitul nostru Deoarece un computer conține de obicei multe cipuri de memorie, este nevoie de un semnal pentru a selecta cip-ul necesar, astfel încât cipul de care avem nevoie să răspundă la apel, iar restul nu Semnalul CS (Chip Select) este utilizat în acest scop Este instalat pentru a porni cipul În plus, avem nevoie de o modalitate de a face distincția între citiri și scrieri Semnalul WE (Write Enable) indică faptul că datele trebuie scrise, nu citite În cele din urmă, semnalul OE (Output Enable) este setat să furnizeze semnale de ieșire Când acest semnal nu este prezent, ieșirea este deconectată de la restul circuitului Capitolul Nivel logic digital Pe fig , b folosește o schemă de adresare diferită Microcircuitul este o matrice de x celule de un bit, care este de Mbps Pentru a accesa un cip, trebuie mai întâi să selectați un rând Pentru a face acest lucru, numărul I-digit al acestei linii este transmis la ieșirile de adresă Apoi este setat semnalul RAS (Row Address Strobe) După aceea, numărul coloanei este aplicat pinilor de adresă și este setat semnalul CAS (Column Address Strobe) Microcircuitul reacționează la semnal prin primirea sau ieșirea de bit de date Cipurile de memorie mari sunt adesea fabricate ca matrice m x n, accesate în rânduri și coloane Această organizare a memoriei reduce numărul de pini necesari, dar, pe de altă parte, încetinește accesul la microcircuit, deoarece sunt necesare două cicluri de adresare: unul pentru rând, celălalt pentru coloană Pentru a accelera acest proces, unele cipuri pot apela o adresă de rând și apoi mai multe adrese de coloane pentru a accesa biții seriali ai rândului Cu mulți ani în urmă, cele mai mari cipuri de memorie erau de obicei aranjate așa cum se arată în Fig b Deoarece dimensiunea cuvântului a crescut de la la de biți și mai mult, a devenit incomod să folosiți astfel de microcircuite Pentru a construi memorie cu cuvinte de de biți din microcircuite de K x , sunt necesare de microcircuite, care funcționează în paralel Aceste de cipuri au o capacitate totală de cel puțin MB Dacă utilizați K x cipuri, veți avea nevoie de doar cipuri, dar memoria va fi de MB Pentru a nu se încurca cu de cipuri, majoritatea producătorilor produc familii de cipuri cu lungimi de cuvinte de , , și biți Situația cu cuvintele pe de biți este, desigur, și mai rea Exemple de cipuri moderne cu o capacitate de Mbit sunt prezentate în fig Fiecare astfel de cip conține patru bănci de memorie internă de Mbit fiecare; în consecință, sunt necesare două linii de selecție a băncii pentru a defini o bancă Pe chipul de M x prezentat în fig , a, sunt alocate linii pentru semnalele RAS, - pentru semnalele CAS și linii - pentru selecția băncii Luate în ansamblu, de semnale oferă capacitatea de a adresa de celule interne de biți Pe un microcircuit de M x , prezentat în fig , b, linii sunt alocate pentru semnalele RAS, linii pentru CAS și linii pentru selecția băncii Astfel, de semnale fac posibilă adresarea oricăreia dintre cele de celule interne de biți Numărul de rânduri și coloane din jetoane este determinat pe baza factorilor de inginerie Matricea nu trebuie să fie pătrată Aceste exemple demonstrează clar importanța a două probleme fără legătură în procesul de proiectare a cipurilor de memorie Primul se referă la lățimea ieșirii (în biți) - cu alte cuvinte, numărul de biți ( , , , etc ) din semnalul de ieșire A doua problemă este modul în care sunt reprezentați biții de adresă; Există două opțiuni aici: în primul rând, biții de adresă pot fi prezentați simultan pe diferiți pini și, în al doilea rând, poate exista o reprezentare secvențială a rândurilor și coloanelor - așa cum se arată în Fig Înainte de a continua cu proiectarea microcircuitului, specialistul trebuie să decidă asupra soluției la ambele probleme Memorie SA A A AZ A A A A A A A O A A RAS CLS Banca O Banca Cip de memorie Mx ( Mbit) D D D D CS WE OE Orez Două moduri de a organiza un cip de memorie de Mbit RAM și ROM Toate tipurile de memorie pe care le-am considerat până acum au un lucru în comun: permit atât scrierea, cât și citirea informațiilor Această memorie se numește RAM (Random Access Memory) sau RAM (Random Access Memory) Există două tipuri de RAM: statică și dinamică RAM statică (SRAM) este construită folosind D-flip-flops Informațiile din RAM sunt stocate atâta timp cât îi este furnizată energie: secunde, minute, ore și chiar zile RAM statică este foarte rapidă De obicei, timpul de acces este de câteva nanosecunde Din acest motiv, RAM statică este adesea folosită ca cache de nivel al doilea În RAM dinamică (Dynamic RAM, DRAM), dimpotrivă, nu se folosesc flip-flops DRAM este o serie de celule, fiecare conținând un tranzistor și un mic condensator Condensatorii pot fi încărcați și descărcați, ceea ce vă permite să stocați zerouri și unități Deoarece sarcina electrică tinde să dispară, fiecare bit din DRAM trebuie actualizat (reîncărcat) la fiecare câteva milisecunde pentru a preveni scurgerea datelor Deoarece logica externă trebuie să se ocupe de actualizare, DRAM necesită o interfață mai complexă decât RAM statică, deși acest dezavantaj este compensat de volumul mare Deoarece DRAM are nevoie doar de tranzistor și condensator pe bit (RAM statică are nevoie de tranzistori pe bit în cel mai bun caz), DRAM are o densitate de scriere foarte mare (mulți biți pe cip) Din acest motiv, memoria principală este aproape întotdeauna construită Capitolul Nivel logic digital bazat pe RAM dinamică Cu toate acestea, DRAM-urile sunt foarte lente (timpul de acces durează zeci de nanosecunde) Astfel, combinația de cache bazată pe RAM statică și memorie principală bazată pe RAM dinamică combină avantajele ambelor dispozitive Există mai multe tipuri de RAM dinamică Cel mai vechi tip încă utilizat este FPM (Fast Page Mode) Această memorie RAM este o matrice de biți Hardware-ul reprezintă adresa rândului și apoi adresele coloanei (am descris acest proces când am vorbit despre dispozitivul de memorie prezentat în Figura b) Semnalele explicite asigură funcționarea asincronă a memoriei și a generatorului principal de ceas al sistemului FPM este înlocuit treptat de memoria EDO (Extended Data Output) , care permite accesarea memoriei înainte ca accesul anterior să se încheie Acest mod pipeline, deși nu accelerează accesul la memorie, îmbunătățește debitul permițând mai multe cuvinte pe secundă Memoriile precum FPM și EDO au rămas relevante în acele zile când timpul de ciclu al cipurilor de memorie nu depășea ns Ulterior, odată cu creșterea vitezei procesoarelor, s-a format nevoia de cipuri de memorie mai rapide, iar apoi modurile asincrone FPM și EDO au fost înlocuite cu RAM dinamică sincronă (Synchronous DRAM, SDRAM) DRAM-ul sincron este controlat de un singur semnal de ceas Acest dispozitiv este un hibrid de memorie RAM statică și dinamică Principalul avantaj al RAM dinamică sincronă este că elimină dependența cipului de memorie de semnalele de control CPU-ul spune memoriei câte cicluri să ruleze și apoi pornește acele cicluri Fiecare ciclu emite , sau biți, în funcție de numărul de linii de ieșire Eliminarea dependenței de semnalele de control duce la o creștere a ratei de transfer de date între CPU și memorie Următorul pas în evoluția SDRAM a fost memoria DDR (Double Data Rate) Această tehnologie oferă date de ieșire atât în față, cât și la scăderea pulsului, drept urmare rata de transfer este dublată De exemplu, un cip de biți de acest tip, care rulează la MHz, emite două valori de biți de de milioane de ori pe secundă (desigur, această viteză este menținută pentru o perioadă scurtă de timp); astfel, teoretic, viteza pe termen scurt poate ajunge la , GB/s Memorie non volatila RAM nu este singurul tip de cipuri de memorie În multe cazuri, datele trebuie păstrate chiar dacă alimentarea este oprită (de exemplu, când vine vorba de jucării, diverse dispozitive și mașini) Mai mult, după instalare Memoria dinamică de tip EDO a înlocuit practic memoria dinamică convențională care funcționează în modul FPM la mijlocul anilor - Notă științific ed Memorie programele sau datele nu trebuie modificate Aceste cerințe au condus la apariția ROM (memorie doar în citire) sau ROM (Memorie numai în citire - memorie doar în citire) ROM-urile nu permit modificarea și ștergerea informațiilor stocate în ele (nici intenționat, nici accidental) Datele sunt scrise pe ROM în timpul producției Pentru a face acest lucru, se realizează un șablon cu un anumit set de biți, care este suprapus pe un material fotosensibil, iar apoi părțile deschise (sau închise) ale suprafeței sunt gravate Singura modalitate de a schimba programul în ROM este schimbarea întregului cip ROM-urile sunt mult mai ieftine decât RAM dacă sunt comandate în vrac pentru a plăti costul realizării unui șablon Cu toate acestea, acestea nu permit modificări după lansarea din producție și pot dura câteva săptămâni între o comandă ROM și finalizarea acesteia Pentru a face mai ușor pentru companii să dezvolte noi dispozitive bazate pe ROM, au fost lansate ROM-uri programabile (ROM-uri programabile, PROM-uri) Spre deosebire de ROM-urile convenționale, acestea pot fi programate pe teren pentru a reduce timpii de livrare Multe ROM-uri programabile conțin o serie de legături fuzibile mici Pentru a arde un anumit jumper, trebuie să selectați rândul și coloana necesare, apoi aplicați o tensiune înaltă unui anumit pin al microcircuitului Următoarea dezvoltare a acestei linii este un ROM programabil șters (Erasable PROM, EPROM), care poate fi programat în teren, precum și ștergerea informațiilor din acesta Dacă fereastra de cuarț din acest ROM este expusă la lumină ultravioletă puternică timp de minute, toți biții vor fi setați la Dacă trebuie făcute multe modificări în timpul unui singur pas de proiectare, ROM-urile ștergebile sunt mult mai economice decât ROM-urile obișnuite, deoarece pot fi refolosit de multe ori ROM-urile programabile șterse sunt de obicei aranjate în același mod ca RAM-urile statice De exemplu, cipul C are o structură care este prezentată în Fig , a, și o astfel de structură este tipică pentru RAM statică Următoarea etapă este un ROM reprogramabil electronic (Electronic EPROM, EEPROM), din care informațiile pot fi șterse prin aplicarea de impulsuri și care nu trebuie să fie plasată într-o cameră specială pentru a o expune la razele ultraviolete În plus, pentru a reprograma acest dispozitiv, nu este nevoie să fie introdus într-un dispozitiv special pentru programare, spre deosebire de un ROM programabil șters În același timp, cele mai mari EEPROM-uri sunt de de ori mai mici decât EEPROM-urile obișnuite și funcționează la jumătate din viteză EEPROM-urile nu pot concura cu DRAM-urile și SRAM-urile deoarece sunt de ori mai lente, au o capacitate de de ori mai mică și sunt mult mai scumpe Ele sunt utilizate numai în acele situații în care este necesar să se salveze informații atunci când alimentarea este oprită Un tip mai modern de EEPROM este memoria flash Spre deosebire de ROM-ul care se șterge, care este șters prin expunerea la razele ultraviolete, și de EEPROM, care este șters octet cu octet, memoria flash este ștearsă și scrisă în blocuri Mulți producători produc plăci de circuite imprimate mici care conțin sute de mega- Capitolul Nivel logic digital octeți de memorie flash Sunt folosite pentru a stoca imagini în camere digitale și în alte scopuri Poate că într-o zi flash-ul va înlocui discurile, ceea ce ar fi un pas uriaș înainte, având în vedere timpul de acces de ns Principala problemă tehnică în acest moment este că memoria flash se uzează după de ștergeri, iar discurile pot dura ani de zile, indiferent de câte ori sunt suprascrise O scurtă descriere a diferitelor tipuri de memorie este dată în tabel Tabelul Caracteristicile diferitelor tipuri de memorie Tip dispozitiv de stocare Categorie Șterge informații Schimbați informații în funcție de octeți Necesar de alimentare Aplicație SRAM Citire/Scriere Electrică Da Da L Cache DRAM Citire/Scriere Electrică Da Da Memorie principală (vechită) SDRAM Citire/Scriere Electrică Da Da Memorie principală (modele noi) ROM Numai citire Imposibil Nu Nu Dispozitive masive PROM Numai citire Nu este posibil Nu Nu Dispozitive de volum mic EPROM Citește predominant lumina UV Nu Fără Simulare dispozitiv EEPROM Citite predominant Electrice Da Nu Simulare dispozitiv Memorie flash Citire și scriere Electrică Nu Nu Camere digitale Chip-uri și magistrale de procesor Deoarece ne-am familiarizat deja cu cipurile MIS și SIS, precum și cu cipurile de memorie, acum putem pune toate componentele împreună și începem să studiem sisteme întregi În această secțiune, ne uităm mai întâi la procesoarele la nivel logic digital, inclusiv la pinouts (adică la semnificația semnalelor de pe diferiții pini) Deoarece CPU-urile sunt strâns legate de magistralele pe care le folosesc, vom sublinia, de asemenea, pe scurt principiile de bază ale proiectării magistralelor În secțiunile următoare, vom descrie în detaliu exemple de procesoare și magistrale pentru acestea Chip-uri și magistrale de procesor Chip-uri de procesor Toate procesoarele moderne se potrivesc pe un singur cip Acest lucru face ca mecanismul interacțiunii lor cu restul sistemului să fie destul de clar Fiecare cip de procesor conține un set de pini prin care se face schimb de informații cu lumea exterioară Unii pini transmit semnale de la CPU, alții primesc semnale de la alte componente, iar alții fac ambele Examinând funcțiile tuturor pinii, putem afla cum interacționează procesorul cu dispozitivele de memorie și I/O la nivel logic digital Concluziile microcircuitului procesorului central pot fi împărțite în trei tipuri: adresă, informații și control Acești pini sunt conectați la pinii corespunzători de pe cipurile de memorie și cipurile dispozitivului I/O printr-un set de fire paralele (numite magistrală) Pentru a apela o comandă, CPU trimite mai întâi adresa acelei comenzi în memorie pe pinii adresei Apoi folosește una sau mai multe linii de control pentru a spune memoriei că are nevoie pentru a citi un cuvânt, de exemplu Memoria răspunde plasând cuvântul necesar pe pinii de informații ale procesorului și semnalând că a fost făcut Când CPU primește acest semnal, citește cuvântul și execută instrucțiunea apelată Comanda poate necesita citirea sau scrierea cuvintelor care conțin date În acest caz, întregul proces se repetă pentru fiecare cuvânt suplimentar Cum se întâmplă procesul de citire și scriere, vom analiza în detaliu mai târziu Între timp, este important să înțelegeți că procesorul comunică cu dispozitivele de memorie și I/O trimițând semnale către pini și primind semnale către intrări Nu există altă modalitate de a face schimb de informații Numărul de pini de adresă și numărul de pini de informații sunt doi parametri cheie care determină performanța unui procesor Un microcircuit care conține m pini de adresă poate accesa m celule de memorie De obicei, m este , , sau Un cip care conține n pini de informații poate citi sau scrie un cuvânt r-bit într-o singură operație De obicei, n este , , , sau Un CPU cu pini de date va avea nevoie de operații pentru a citi un cuvânt de de biți, în timp ce un CPU cu de pini de date poate face aceeași sarcină într-o singură operațiune Prin urmare, un cip cu de pini de informații este mult mai rapid, dar și mult mai scump Pe lângă ieșirile de adresă și informații, fiecare procesor conține ieșiri de control Acești pini vă permit să reglați și să sincronizați fluxul de date către și de la procesor și să efectuați alte funcții Toate procesoarele conțin pini pentru alimentare (de obicei + , V sau + V), masă și ceas (pătrat) Restul pinii variază de la procesor la procesor Cu toate acestea, concluziile de control pot fi împărțite în mai multe categorii principale: ♦ management autobuz; ♦ întrerupe; + arbitraj autobuz; Capitolul Nivel logic digital ♦ semnale coprocesor; + stare; ♦ diverse În cele ce urmează, vom descrie pe scurt fiecare dintre aceste categorii, iar când ne uităm la cipurile Pentium , UltraSPARC III și , vom oferi informații mai detaliate O schemă a unui CPU tipic care utilizează aceste tipuri de semnale este prezentată în Fig Adresarea Date Gestionarea autobuzelor întreruperi Autobuz Arbitraj Coprocesor Stat Alte Semnale Simbol Ф + V împământare Caracter XI Tensiune de sincronizare semnal V Orez Pinout-ul unui procesor tipic Săgețile indică semnalele de intrare și de ieșire Liniile diagonale scurte indică prezența mai multor cabluri de acest tip Numărul acestor pini depinde de modelul procesorului Pinii de control al magistralei sunt în cea mai mare parte ieșirile de la CPU către magistrală (și, prin urmare, intrările către cipurile de memorie și cipurile I/O) Acestea vă permit să indicați că procesorul dorește să citească informații din memorie sau să scrie informații în memorie sau să facă altceva Pinii de întrerupere sunt intrări de la dispozitivele I/O către procesor În majoritatea sistemelor, procesorul poate semnala unui dispozitiv I/O să înceapă o operație și apoi să facă altceva în timp ce dispozitivul I/O își face treaba Când dispozitivul I/O îl termină, controlerul I/O trimite un semnal către unul dintre pinii de întrerupere pentru a întrerupe procesorul și a-l forța să întrețină dispozitivul I/O (de exemplu, verificați erorile I/O) Unele procesoare includ un pin de ieșire conceput pentru a confirma primirea unui semnal de întrerupere Pinii de arbitraj de magistrală sunt necesari pentru a regla fluxul de informații pe magistrală, adică pentru a preveni astfel de situații când două dispozitive încearcă să folosească magistrala în același timp În ceea ce privește arbitrajul, procesorul este considerat a fi doar unul dintre dispozitive Unele procesoare pot funcționa cu co-procesoare diferite (de exemplu, GPU-uri, procesoare pentru procesare Chip-uri și magistrale de procesor valori în virgulă mobilă etc ) Pentru a asigura schimbul de informații între procesor și coprocesor, se folosesc pini speciali Pe lângă acești pini, unele procesoare au pini suplimentari Unele dintre ele emit sau primesc informații de stare, altele sunt necesare pentru a reporni computerul, iar altele sunt concepute pentru a asigura compatibilitatea cu cipurile dispozitivelor I/O mai vechi Anvelope pentru computer O magistrală este un set de fire care conectează diferite dispozitive Anvelopele pot fi clasificate în funcție de funcția lor Acestea pot fi interne procesorului și servesc la transferul de date către și de la ALU, sau pot fi externe procesorului și pot conecta procesorul la memorie sau la dispozitive I/O Fiecare tip de anvelopă are anumite proprietăți, iar fiecare dintre ele are anumite cerințe În aceasta și în următoarele subsecțiuni, ne vom concentra asupra magistralelor care conectează CPU la memorie și dispozitivele I/O În capitolul următor, vom arunca o privire mai atentă asupra magistralelor interne ale procesorului Primele computere personale aveau o singură magistrală externă, numită magistrală de sistem Acesta a constat din mai multe fire de cupru (de la la ) care au fost încorporate în placa de bază Pe placa de bază, la distanțe egale unul de celălalt, existau conectori pentru cipuri de memorie și dispozitive de intrare-ieșire Calculatoarele personale moderne conțin de obicei o magistrală dedicată între CPU și memorie și cel puțin o altă magistrală pentru dispozitivele I/O Pe fig Figura prezintă un sistem cu o magistrală de memorie și o magistrală I/O În literatură, anvelopele sunt de obicei descrise ca săgeți îndrăznețe, așa cum se arată în această figură Diferența dintre săgeata aldină și săgeata fără aldine, Capitolul Nivel logic digital prin care trece o linie diagonală scurtă care indică numărul de biți, mic Când tipul tuturor biților este același, de exemplu, toți biții de adresă sau toți biții de date, este desenată o săgeată obișnuită Când adresa, datele și liniile de control sunt activate, se folosește o săgeată aldine În timp ce proiectanții de procesoare pot folosi orice tip de magistrală pentru un cip, trebuie aplicate reguli clare despre modul în care funcționează magistrala; și toate dispozitivele conectate la magistrală trebuie să respecte aceste reguli, astfel încât plăcile de la terți să se potrivească magistralei de sistem Aceste reguli se numesc protocol de magistrală În plus, trebuie să existe anumite cerințe tehnice pentru ca plăcile de la terți să se potrivească în șinele PCB și să aibă conectori care se potrivesc mecanic cu placa de bază în ceea ce privește tensiunile, sincronizarea etc Există o serie de autobuze utilizate pe scară largă în lumea computerelor, de exemplu: Omnibus (PDP- ), Unibus (PDP- ), Multibus ( ), IBM PC (PC/XT), ISA (PC/AT), EISA ( ), Microchannel (PC/ ), PCI (diverse computere personale), SCSI (diverse computere personale și stații de lucru), Nubus (Macintosh), Universal Serial Bus (calculatoare personale moderne), FireWire (electronice de larg consum), VME ( echipamentul clasei de fizică) și Satae (fizica înaltelor energii) Poate că lucrurile ar fi mult mai ușor dacă toate cauciucurile, cu excepția uneia sau două, ar dispărea de pe suprafața pământului Din păcate, standardizarea în acest domeniu pare foarte puțin probabilă, deoarece deja au fost investiți prea mulți bani în toate aceste sisteme incompatibile Să începem cu modul în care funcționează anvelopele Unele dispozitive conectate la magistrală sunt active și pot iniția comunicarea pe magistrală, în timp ce altele sunt pasive și așteaptă cereri Dispozitivul activ se numește master, dispozitivul pasiv se numește slave Când CPU solicită controlerului de disc să citească sau să scrie un bloc de informații, CPU acționează ca master și controlerul de disc acționează ca slave Controlerul de disc poate acționa ca un master atunci când spune memoriei să accepte cuvintele pe care le-a citit de pe disc Câteva combinații tipice master și slave sunt enumerate în Tabelul Memoria în niciun caz nu poate fi un dispozitiv principal Tabelul Exemple de maestru și sclav Dispozitiv master Dispozitiv slave Exemplu Memoria CPU Apelarea comenzilor și a datelor Dispozitiv I/O CPU Inițializează transferul de date Unitate centrală de procesare Coprocesor Trimiterea unei comenzi de la procesor la coprocesor Dispozitiv I/O Memorie DMA CPU coprocesor Coprocesorul apelează operanzi de la CPU Chip-uri și magistrale de procesor Semnalele binare produse de dispozitivele computerizate nu sunt adesea suficient de puternice pentru a activa magistrala, mai ales dacă este suficient de lungă și dacă la el sunt conectate multe dispozitive Din acest motiv, majoritatea driverelor de autobuz sunt de obicei conectate la magistral printr-un cip numit driver de magistrală, care este în esență un amplificator binar În mod similar, majoritatea dispozitivelor slave sunt conectate la magistrală printr-o chiuvetă de magistrală Pentru dispozitivele care pot fi atât master cât și slave, se folosește un transceiver magistrală sau transceiver Aceste cipuri, concepute pentru a interacționa cu autobuzul, sunt adesea dispozitive cu trei stări, oferindu-le posibilitatea de a se detașa atunci când nu sunt necesare Uneori sunt conectate printr-un colector deschis, ceea ce dă un efect similar Când unul sau mai multe dispozitive colectoare deschise solicită accesul la magistrală în același timp, rezultatul este o operație booleană OR pe toate aceste semnale Un astfel de acord se numește SAU de montaj Pe majoritatea autobuzelor, unele linii sunt dispozitive tri-state, iar altele care necesită o proprietate cu fir SAU sunt open-collector Ca și procesorul, magistrala are linii de adresă, date și control Cu toate acestea, este posibil să nu existe o corespondență unu-la-unu între pinii procesorului și semnalele magistralei De exemplu, unele procesoare au trei pini care oferă un semnal de citit sau de scris în memorie, de citit de pe un dispozitiv I/O, de a scrie pe un dispozitiv de I/O sau de a efectua o altă operațiune O magistrală obișnuită poate conține o linie pentru citirea din memorie, o a doua pentru scrierea în memorie, o a treia pentru citirea de la un dispozitiv I/O, o a patra pentru scrierea pe un dispozitiv I/O etc Atunci cipul trebuie să conecteze procesorul la o astfel de magistrală - un decodor conceput pentru a converti un semnal codat pe biți în semnale separate care pot conduce linii de magistrală Dezvoltarea anvelopelor și principiile de funcționare a anvelopelor sunt probleme destul de complexe, iar pe acest subiect au fost scrise o serie de cărți [I, ] Principalele probleme de proiectare sunt lățimea autobuzului, sincronizarea autobuzului, arbitrarea autobuzului și performanța autobuzului Toți acești parametri afectează semnificativ debitul magistralei În următoarele patru subsecțiuni, ne vom uita la fiecare dintre ele Latimea anvelopei Lățimea magistralei (numărul de linii de adresă) este cel mai evident parametru de proiectare Cu cât magistrala conține mai multe linii de adresă, cu atât mai multă memorie poate accesa procesorul Dacă magistrala conține n linii de adresă, atunci procesorul o poate folosi pentru a adresa locații de memorie diferite de " Memoria de capacitate mare necesită multe linii de adresă Asta sună destul de simplu Problema este că anvelopele late necesită mai multe fire decât cele înguste Ocupă mai mult spațiu fizic (de ex pe placa de bază) și necesită conectori mai mari Toate acestea Capitolul Nivel logic digital Factorii fac ca anvelopa să fie costisitoare Prin urmare, trebuie făcut un compromis între cantitatea maximă de memorie disponibilă și costul sistemului Un sistem cu o magistrală care conține de linii de adresă și de octeți de memorie va costa mai mult decât un sistem cu o magistrală care conține de linii de adresă și aceiași de octeți de memorie Extinderea ulterioară nu este gratuită Mulți designeri de sisteme au fost miopi, s-au inversat Primul model de PC IBM conținea un procesor și o magistrală de adrese de de biți (Fig , a) Autobuzul a permis accesul la MB de memorie adresa pe de biți Control adresa pe biți Control adresa pe de biți Control adresa pe biți Control adresa pe biți Control b V Orez Extinderea magistralei de adrese în timp Când a sosit următorul procesor ( ), Intel a decis să mărească spațiul de adrese la MB, așa că au trebuit adăugate încă benzi (păstrând cele inițiale din motive de compatibilitate inversă), așa cum se arată în Figura b Din păcate, au trebuit adăugate și linii de control pentru noile linii de adresă Când a apărut procesorul , s-au adăugat încă linii de adresă și, bineînțeles, mai multe linii de control, așa cum se arată în fig , c Rezultatul este un autobuz EISA Cu toate acestea, ar fi mai bine dacă ar exista de linii de la bun început În timp, nu doar numărul liniilor de adresă crește, ci și numărul liniilor de informații, deși acest lucru se întâmplă dintr-un motiv diferit Există două moduri de a crește lățimea de bandă a magistralei: reduceți timpul ciclului magistralei (efectuați mai multe transferuri pe secundă) sau măriți lățimea magistralei de date (adică creșteți numărul de biți transferați pe ciclu) Este posibil să creșteți viteza autobuzului, dar este destul de dificil să faceți acest lucru, deoarece semnalele pe diferite linii sunt transmise la viteze diferite (acest fenomen se numește declin de magistrală) Cu cât rulează mai repede anvelopa, cu atât este mai înclinată Pe măsură ce viteza autobuzului crește, apare o altă problemă: în acest caz, acesta devine incompatibil cu versiunile anterioare Plăcile vechi concepute pentru un autobuz mai lent nu pot funcționa cu cel nou Un astfel de si Chip-uri și magistrale de procesor Această opțiune este neprofitabilă pentru proprietarii și producătorii de plăci vechi Prin urmare, este obișnuit să adăugați pur și simplu linii noi pentru a crește productivitatea, așa cum se arată în Fig După cum vă puteți imagina, acest lucru are și dezavantajele sale IBM PC și succesorii săi, de exemplu, au început cu linii de date, apoi au trecut la , apoi la de linii, toate pe aceeași magistrală Pentru a rezolva această problemă, dezvoltatorii preferă uneori magistrala multiplex În acest autobuz nu există o împărțire în linii de adresă și informații Poate avea, de exemplu, de linii atât pentru adrese, cât și pentru date Aceste linii sunt folosite mai întâi pentru adrese, apoi pentru date Pentru a scrie informații în memorie, trebuie mai întâi să transferați adresa în memorie, apoi datele În cazul liniilor separate, adresele și datele pot fi transmise împreună Îmbinarea liniilor reduce lățimea și costul autobuzului, dar sistemul este mai lent Prin urmare, dezvoltatorii trebuie să cântărească argumentele pro și contra înainte de a face o alegere Ora autobuzului Anvelopele pot fi împărțite în două categorii în funcție de momentul lor Autobuzul sincron conține o linie care este condusă de un oscilator cu cristal Semnalul pe această linie este o undă pătrată cu o frecvență de obicei de la la MHz Orice acțiune de magistrală necesită un număr întreg de așa-numitele cicluri de magistrală Magistrala asincronă nu conține un oscilator principal Ciclurile magistralei pot fi arbitrare și nu sunt neapărat aceleași pentru toate perechile de dispozitive În continuare, vom lua în considerare fiecare tip de anvelopă separat Anvelope sincrone Ca exemplu al modului în care funcționează o magistrală asincronă, luați în considerare diagrama de timp din Fig În acest exemplu, vom folosi un oscilator principal de MHz, care oferă un ciclu de magistrală de ns Deși poate părea că magistrala este lentă în comparație cu procesoarele de GHz și mai mari, nu multe autobuze moderne sunt mai rapide De exemplu, populara magistrală PCI rulează la MHz sau MHz Motivele pentru o viteză atât de scăzută a anvelopelor moderne au fost deja discutate: probleme tehnice precum deformarea anvelopelor și nevoia de compatibilitate pot fi atribuite acestora În exemplul nostru, presupunem că citirea informațiilor din memorie durează ns din momentul în care adresa este setată După cum vom vedea în curând, este nevoie de trei cicluri de autobuz pentru a citi un cuvânt Primul ciclu începe în partea din față a segmentului Tt, iar al treilea se termină în partea din față a segmentului T , așa cum se arată în fig Rețineți că niciuna dintre creșteri și căderi nu sunt desenate vertical, deoarece niciun semnal electric nu își poate schimba valoarea în timp zero În exemplul nostru, presupunem că este nevoie de ns pentru ca semnalul să se schimbe Generatorul și liniile de adresă și date, precum și liniile MREQ, RD, WAIT sunt afișate pe aceeași scară de timp Pornirea este determinată de partea din față a generatorului În timp, CPU plasează adresa cuvântului dorit pe liniile de adresă Deoarece o adresă nu este o singură valoare (spre deosebire de un generator), nu putem Capitolul Nivel logic digital arătați-l ca o singură linie pe diagramă În schimb, am arătat-o ca două linii cu intersecții în care această adresă se schimbă Culoarea gri de pe diagramă arată că în acest moment nu contează ce valoare a luat semnalul Folosind aceeași convenție, vedem că conținutul liniilor de date nu contează până la segmentul T Orez Diagrama de timp a procesului de citire pe magistrala sincronă După ce liniile de adresă au posibilitatea de a dobândi o nouă valoare, semnalele MREQ și RD sunt setate Primul indică faptul că se accesează memoria și nu dispozitivul I/O, iar al doilea indică faptul că citirea este în curs, nu scrierea Deoarece este nevoie de ns (parte a primului ciclu) pentru a citi informațiile din memorie după setarea adresei, memoria nu poate transfera datele necesare în perioada T Pentru a împiedica CPU să aștepte sosirea datelor, memoria setează semnalul WAIT la începutul segmentului T Aceasta înseamnă introducerea unor perioade de așteptare (cicluri suplimentare de magistrală) până când memoria resetează semnalul WAIT În exemplul nostru, este introdusă o perioadă de așteptare (T ), deoarece memoria este prea lentă La începutul segmentului T , când există încredere că memoria va primi date în timpul ciclului curent, semnalul WAIT este resetat În prima jumătate a T , memoria plasează date pe liniile de informații La declinul segmentului T , procesorul central strobocizează (adică citește) liniile de informații, stocând valorile acestora în registrul intern După citirea datelor, procesorul resetează semnalele MREQ și RD Dacă este necesar, un alt ciclu de memorie poate începe pe următorul front Această secvență poate fi repetată la infinit Chip-uri și magistrale de procesor În continuare, se clarifică semnificația a opt simboluri din diagrama de timp (vezi Fig ) - acestea sunt enumerate în tabel TAD, de exemplu, este intervalul de timp dintre creșterea și setarea liniilor de adresă Conform cerințelor de sincronizare TAD ' F Sursă energie Orez Pinout-ul procesorului Pentium Denumirile oficiale ale semnalelor individuale sunt date cu majuscule; nume general acceptate ale grupurilor de semnale înrudite și descrieri ale semnalelor - litere mici CPU sau alt master de magistrală poate emite o cerere de acces la magistrală folosind următorul grup de semnale Adresele au de biți, dar ultimii trei biți trebuie să fie întotdeauna și, prin urmare, nu au pini proprii, deci grupul A# are doar de pini Toate transmisiile constau din octeți Deoarece adresa conține de biți, memoria maximă este de , adică GB Când o adresă este trimisă către magistrală, semnalul ADS# este setat Acest semnal informează ținta (de exemplu, memoria) despre valabilitatea liniilor de adresă Liniile REQ# încep un ciclu de magistrală de un anumit tip (de exemplu, citirea unui cuvânt sau scrierea unui bloc) Sunt necesare două semnale de paritate pentru a verifica A# și REQ# Cinci linii speciale transmit mesaje de eroare în operațiuni cu virgulă mobilă, interne, mașini (hardware) și alte erori Capitolul Nivel logic digital Semnalele de răspuns sunt transmise de la slave la master Semnalul RS# conține un cod de stare Semnalul TRDY# indică faptul că slave (țintă) este pregătit să primească date de la master Aceste semnale sunt verificate de paritate În cazul în care ținta nu răspunde la timp, se stabilește o așteptare cu semnalul BNR# Ultimul grup de semnale este necesar pentru transmiterea datelor Semnalul D# permite trimiterea a octeți de date către magistrală Când datele intră în magistrală, este emis semnalul DRDY# (semnal de date pe magistrală) Le spune dispozitivelor că magistrala este ocupată în prezent Verificarea parității se aplică și aici Unele semnale sunt responsabile pentru blocarea și alte operațiuni de date Semnalul RESET# este necesar pentru a reporni procesorul în cazul unei defecțiuni sau când utilizatorul apasă butonul de resetare de pe panoul frontal al unității de sistem Pentium poate implementa întreruperi în același mod ca și (necesar din motive de compatibilitate) sau poate utiliza noul sistem de întrerupere cu dispozitivul Advanced Programmable Interrupt Controller (APIC) Pentium poate funcționa la oricare dintre mai multe tensiuni prestabilite, dar procesorul trebuie să știe la ce tensiune va funcționa Semnalele de gestionare a puterii sunt utilizate pentru a selecta automat tensiunea de alimentare, pentru a notifica procesorului despre stabilitatea puterii și pentru o serie de alte operațiuni conexe Cu ajutorul lor, se realizează tranziția la diferite stări de somn, care, desigur, sunt unul dintre instrumentele de gestionare a energiei În ciuda mecanismului sofisticat de gestionare a energiei, Pentium poate atinge temperaturi foarte ridicate Un grup de semnale de control al temperaturii permite procesorului să alerteze dispozitivele din jur despre pericolul supraîncălzirii Aceasta include, de exemplu, un semnal dat de CPU atunci când temperatura sa internă depășește °C ( °F) Deși dacă temperatura procesorului depășește °C, probabil că deja visează la pensie și la un serviciu conștiincios ca încălzitor Grupul de semnal de ceas este responsabil pentru determinarea frecvenței magistralei sistemului Grupul de semnale de diagnosticare este destinat testării și depanării sistemelor conform standardului IEEE JTAG Grupul de semnale de inițializare servește la încărcarea (pornirea) sistemului În cele din urmă, există un grup de semnale diverse, printre care, printre altele, există un semnal care indică faptul că soclul CPU este ocupat, un semnal care servește modul de emulare și altele Conducerea magistralei de memorie a procesorului Pentium Procesoarele moderne, cum ar fi Pentium , sunt mult mai rapide decât RAM dinamică de astăzi Pentru ca procesorul să nu funcționeze, este necesară cea mai mare performanță posibilă a memoriei Din acest motiv, magistrala de memorie a procesorului Pentium funcționează în modul pipeline, cu operațiuni care au loc simultan pe magistrală Am luat în considerare conceptul de transportor Exemple de procesoare în capitolul când am vorbit despre procesoare pipeline Rețineți că memoria poate fi, de asemenea, canalizată Accesul procesorului la memorie, care se numește tranzacții, consta în șase faze: Arbitraj autobuz Cerere Mesaj de eroare Urmărire Răspunde Transfer de date Toate cele șase faze sunt opționale Faza de arbitraj cu autobuzul determină care șofer va fi următorul În faza de solicitare, o adresă este trimisă către autobuz În timpul fazei de raportare a erorilor, slave trimite un semnal că există o eroare de paritate în adresă sau o altă problemă În faza de urmărire, CPU verifică dacă cuvântul de care are nevoie se află în memoria cache a altui CPU Această fază este necesară doar pe sistemele multiprocesor În următoarea fază, șoferul va ști de unde să obțină datele necesare Ultima fază este transferul de date Într-un sistem cu procesor Pentium , fiecare fază folosește anumite semnale care sunt diferite de semnalele altor faze, deci fiecare dintre ele este independentă de celelalte Șase grupuri din aceste semnale sunt prezentate în partea stângă a fig De exemplu, unul dintre procesoare poate încerca să obțină acces la magistrală folosind semnale de arbitrare De îndată ce procesorul obține acces la magistrală, eliberează aceste linii de magistrală și captează liniile de solicitare Între timp, un alt procesor sau un dispozitiv I/O poate intra în faza de arbitrare a magistralei, și așa mai departe Figura ilustrează situația în care tranzacțiile multiple sunt executate în același timp Faza de arbitraj autobuz din fig nu este afișat deoarece nu este întotdeauna necesar De exemplu, dacă dispozitivul care deține în prezent magistrala (adesea CPU-ul) dorește să facă o altă tranzacție, nu trebuie să acceseze din nou magistrala Trebuie să solicitați din nou autobuzul doar dacă acesta l-a cedat altui dispozitiv Tranzacțiile și sunt normale: cinci faze pe cinci cicluri de magistrală În timpul tranzacției , este introdusă o fază mai lungă de transfer de date (când, de exemplu, trebuie transferat un întreg bloc sau este intrat într-un mod de așteptare) Ca urmare, tranzacția nu poate începe faza de transfer de date imediat după faza de răspuns Faza de transfer de date nu începe până când semnalul DBSY# nu este șters Faza de răspuns din tranzacția poate dura, de asemenea, mai multe cicluri de magistrală, ceea ce întârzie tranzacția În cele din urmă, vedem că tranzacția experimentează și o întârziere În realitate, este puțin probabil ca CPU să încerce să înceapă o nouă tranzacție la fiecare ciclu de magistrală, așa că timpii de inactivitate nu sunt atât de lungi În partea stângă a figurii sunt afișate doar grupuri Semnalele unei alte faze (faza de urmărire) din anumite motive au ajuns în partea dreaptă a figurii - Notă ed Orez Conducerea magistralei de memorie pe un sistem cu procesor Pentium Capitolul Nivel logic digital Exemple de procesoare UltraSPARC III Ca un al doilea exemplu de procesor, să luăm familia UltraSPARC (produsă de Sun) Familia UltraSPARC este o linie de procesoare SPARC pe de biți Aceste procesoare sunt pe deplin compatibile cu arhitectura SPARC versiunea , tot pe de biți Sunt utilizate în stațiile de lucru și serverele Sun și în multe alte sisteme Familia include procesoarele UltraSPARC I, UltraSPARC II și UltraSPARC III, care au o arhitectură similară, dar diferă în ceea ce privește data lansării și viteza de ceas Vom vorbi despre procesorul UltraSPARC III în cele ce urmează, deoarece avem nevoie de un exemplu specific, dar caracteristicile arhitecturale (adică, independente de implementare) sunt în cea mai mare parte valabile pentru alte tipuri UltraSPARC UltraSPARC III este un motor tradițional RISC Este pe deplin compatibil cu procesorul SPARC V pe de biți Singura diferență dintre UltraSPARC III și SPARC V este suportul pentru comenzile VIS , care sunt concepute pentru aplicații de grafică D, decodare MPEG în timp real, compresie de date, procesare a semnalului, execuție a programelor Java și rețea Procesorul UltraSPARC III este adesea instalat în stațiile de lucru, dar a fost proiectat inițial pentru servere multiprocesoare cu memorie partajată utilizate pe Internet și rețelele corporative Cu alte cuvinte, fiecare cip UltraSPARC III include elementele de conectare necesare pentru a construi un multiprocesor Primul UltraSPARC III, introdus în , rula la MHz și avea șiruri de , µm pe bază de aluminiu Cipurile conțineau de milioane de tranzistori Sun nu are propria sa unitate de producție a procesoarelor care să îndeplinească cele mai recente cerințe de tehnologie, așa că folosește contractori direcți de producție pentru a se concentra pe proiectarea cipurilor și dezvoltarea de software În cazul UltraSPARC III, acest contractant este Texas Instruments (TI) În , după modernizarea bazei tehnologice a TI, a început producția de microcircuite cu o frecvență de ceas de MHz și o lățime de linie de , microni; totodată, conductoarele de aluminiu au fost înlocuite cu altele de cupru Până în , lățimea liniei a fost redusă la , µm, iar viteza de ceas a crescut la , GHz Toate aceste cipuri necesită o putere de intrare de W, așa că problemele de disipare a căldurii sunt la fel de relevante pentru ele ca și pentru Pentium Cipurile CISC (cum ar fi Pentium ) și cipurile RISC (cum ar fi UltraSPARC III) nu sunt comparabile doar pe baza vitezei de ceas Să presupunem că procesorul UltraSPARC este capabil să ruleze patru instrucțiuni pe ciclu, ceea ce înseamnă că viteza sa de execuție este aproape aceeași cu cea a unui procesor care rulează la , GHz, dar capabil să execute doar o instrucțiune pe ciclu În plus, UltraSPARC are șase conducte interne, dintre care două sunt de etape fiecare pentru operațiuni întregi, două pentru operațiuni cu virgulă mobilă, una pentru operațiuni de încărcare/stocare și una pentru ramificare În plus, UltraSPARC implementează tehnologia originală de cache, există mai largi Capitolul Nivel logic digital anvelope, ca să nu mai vorbim de alți factori de îmbunătățire a performanței Pentium are, de asemenea, avantajele sale, adică compararea a două microcircuite complet diferite pe baza frecvențelor lor de ceas nu oferă rezultate precise în legătură cu o anumită sarcină Cipul UltraSPARC III conține de pini într-un pachet LGA (Land Grid Array), așa cum se arată în fig Pinii sunt situati in partea de jos a cipului sub forma unei matrice patrate de x (total ), careia ii lipseste un pin in coltul din stanga jos Conectorul corespunde pe deplin cu locația pinii de pe microcircuit, ceea ce elimină posibilitatea instalării incorecte Orez Cip de procesor UltraSPARC III Procesorul UltraSPARC III conține cache interne L : KB pentru instrucțiuni și KB pentru date În plus, sunt furnizate un cache de preluare prealabilă de KB și un cache de scriere de aceeași capacitate; acesta din urmă acumulează operațiuni de scriere și le transferă în cache-ul de al doilea nivel în blocuri mari, optimizând astfel consumul de lățime de bandă La fel ca Pentium , cache-ul L este off-chip, dar spre deosebire de Pentium , procesorul UltraSPARC III nu este împachetat cu cache-ul L (separat de controlerul de cache și de logica de detectare a blocurilor de cache) ), astfel încât dezvoltatorii au dreptul pentru a alege orice chips-uri pentru a implementa acestea din urmă Decizia de a combina memoria cache L cu procesorul (ca la Pentium ) sau de a o împărți cu procesorul (ca și la UltraSPARC III) este condusă de o alegere între diferite avantaje tehnice, precum și caracteristici de la Intel și Sun Cache-ul extern este mai mare și mai flexibil (cache-ul procesorului UltraSPARC III variază de la la MB; cache-ul procesorului Pentium este fixat la KB), dar este mai lent datorită locației sale mai departe de procesor Sunt necesare mai multe semnale pentru a accesa memoria cache externă În special, de biți sunt alocați pentru conexiunea dintre cache-urile UltraSPARC III și L , ceea ce înseamnă că această conexiune permite ca un bloc de date cache de de octeți să fie transferat într-un ciclu Exemple de procesoare În ceea ce privește caracteristicile de producție, Intel este un producător de semiconductori, așa că are capacitatea de a proiecta și produce propriile cipuri cache L și de a comunica cu procesorul prin propria interfață de înaltă performanță Sun, dimpotrivă, este un producător de computere, nu de cipuri Uneori își proiectează propriile cipuri (cum ar fi UltraSPARC III), dar externalizează producția acestora către producătorii de semiconductori În principiu, Sun folosește cipuri disponibile în comerț RAM statică L cache este disponibilă de la diverși furnizori, așa că nu era nevoie ca Sun să-și dezvolte propria RAM Și dacă memoria RAM nu este special concepută, atunci trebuie să instalați memoria cache de nivel al doilea separat de procesorul central Pentru a conecta procesoarele UltraSPARC III la modulele de memorie, Sun a dezvoltat o interfață UPA (Ultra Port Architecture) de mare viteză UPA poate fi implementat ca o magistrală, un comutator sau o combinație a ambelor Diferitele stații de lucru și servere utilizează diferite implementări UPA Implementarea UPA nu depinde în niciun fel de procesor, deoarece interfața UPA este definită cu precizie, iar procesorul trebuie (și face) să suporte această interfață Pe fig vedem nucleul sistemului UltraSPARC III: procesorul central, interfața UPA și cache-ul de al doilea nivel ( RAM statice) În figura se prezintă și cipul UDB II (UltraSPARC Data Buffer II), ale cărui funcții le vom discuta mai jos Când procesorul are nevoie de un cuvânt din memorie, mai întâi accesează memoria cache de primul nivel Dacă găsește un cuvânt, continuă să efectueze operațiuni la viteză maximă Dacă nu găsește cuvântul în memoria cache de primul nivel, trece în memoria cache de al doilea nivel Deși vom discuta despre funcționarea memoriei cache în detaliu în Capitolul , merită totuși să spunem câteva cuvinte despre aceasta aici Toată memoria principală este subdivizată în linii cache (blocuri) de de octeți Cache-ul L conține cele de linii de instrucțiuni cele mai utilizate și cele de linii de date cele mai utilizate Cache-ul L conține linii care nu s-ar încadra în memoria cache L Cache-ul de al doilea nivel conține linii de date și comenzi intercalate Ele sunt stocate în RAM statică, care în Fig este indicat printr-un bloc cu inscripția "Memoria cache de date de al doilea nivel" Sistemul trebuie să urmărească ce linii se află în memoria cache L Aceste informații sunt stocate în a doua RAM statică, prezentată în Fig ca "etichete cache de nivel " În absența liniei dorite în cache-ul de primul nivel, CPU trimite identificatorul liniei pe care o caută (adresa etichetei) către cache-ul de al doilea nivel Răspunsul (date de etichetă) oferă CPU-ului informații despre dacă linia dorită se află în memoria cache L Dacă există o linie, procesorul o primește Datele sunt transferate în trepte de octeți, deci este nevoie de cicluri pentru a transfera o linie întreagă în memoria cache L Capitolul Nivel logic digital Orez Structura de bază a sistemului UltraSPARC III Dacă linia necesară nu se află în cache-ul de al doilea nivel, trebuie apelată din memoria principală prin interfața UPA UPA într-un sistem UltraSPARC III este implementat de un controler centralizat Semnalele de adresă și semnalele de control de la procesorul central (sau procesoarele, dacă sunt mai multe) ajung acolo Pentru a accesa memorie, CPU trebuie mai întâi să aibă permisiunea de a utiliza magistrala Când magistrala este acordată unui procesor, acesta primește un semnal de la pinii de adresă, determină tipul de solicitare și trece semnalul pe pinul de adresă dorit (acești pini sunt bidirecționali deoarece alte procesoare dintr-un sistem UltraSPARC III trebuie să acceseze la distanță) blocuri cache) Adresa și tipul ciclului magistralei sunt transferate la pinii de adresă în două cicluri, primul ciclu producând un rând și al doilea ciclu producând o coloană, așa cum am discutat în discuția din Fig În timp ce așteptați rezultatele, procesorul poate face alte lucrări De exemplu, absența instrucțiunii dorite în cache nu împiedică executarea uneia sau mai multor instrucțiuni care sunt deja apelate și fiecare dintre ele poate accesa date care nu se află în cache Astfel, mai multe tranzacții UPA pot fi în așteptare simultan UPA poate gestiona două fluxuri independente de tranzacții (de obicei o citire și una de scriere), fiecare flux rulând cu câteva întârzieri Sarcina controlerului centralizat este să țină evidența tuturor acestor lucruri și să facă accesări la memorie în cea mai rațională ordine Datele din memorie vin în blocuri de octeți Pentru o mai mare fiabilitate, acestea conțin un cod de corectare a erorilor pe biți Puteți solicita întregul bloc cache ( octeți) sau chiar mai puțin Toate intrările vin Exemple de procesoare în tamponul UDB și stocat acolo Bufferul UDB este necesar pentru a permite procesorului și memoriei să funcționeze asincron De exemplu, dacă CPU trebuie să scrie un cuvânt sau o linie cache în memoria principală, este posibil să nu aștepte un acces UPA, ci să scrie datele imediat într-un buffer UDB, care le va livra mai târziu în memorie UDB generează, de asemenea, un cod de corectare a erorilor Rețineți că descrierea procesoarelor UltraSPARC III și Pentium din această carte este foarte simplificată Cu toate acestea, esența muncii lor a fost reușită Pentium și UltraSPARC III sunt procesoare de înaltă performanță concepute pentru computere personale și stații de lucru de înaltă performanță Cu toate acestea, există și alte computere - așa-numitele sisteme încorporate Acestea sunt pe care le vom lua în considerare aici folosind exemplul procesorului Nu este exagerat să spunem că practic orice dispozitiv electronic care valorează mai mult de USD conține un computer încorporat Televizoarele, telefoanele mobile, secretarele electronice, cuptoarele cu microunde, camerele video, aparatele video, imprimantele laser, sistemele de alarmă împotriva intrușilor, aparatele auditive, jocurile electronice și multe alte dispozitive (lista este nesfârșită) sunt controlate de un computer În acest caz, se pune accent nu pe performanța ridicată, ci pe costul redus al unui computer încorporat, ceea ce duce la un echilibru ușor diferit de avantaje și dezavantaje față de procesoarele despre care am discutat până acum Am menționat în capitolul că este în prezent cel mai obișnuit microcontroler O astfel de popularitate se datorează în primul rând costului său scăzut După cum vom vedea mai târziu, este un cip mic la care este foarte ușor să conectați alte dispozitive Structura sa fizică este prezentată în Fig R SGY P C P E: C P C P C P C P C P C RSTC r VSS RXD / R C THR/ R S INT / P I INT / RZ Z C TO / R S T / P WRZ P C RD / Р С ZI RO O / AD ZJ ROL ZAD ZI P / AD ZI RO / AD =□ P ZAD ZJ P / AD P / AD P / AD Z EA/VPP =] ALE PSEN XTAL C XTAL De la VSSO ZJ P /A ZJP /A I P /A Р /А ZI P / A I P /A Р /А J R / A Orez Aspectul fizic al cipului Capitolul Nivel logic digital După cum puteți vedea în această diagramă, este de obicei furnizat într-un pachet standard cu de pini (deși alte pachete sunt disponibile pentru aplicații specifice) Acest cip are linii de adresă, limita de adrese de memorie este de KB Lățimea magistralei de date este de biți, ceea ce înseamnă că schimbul de date între CPU și memorie se realizează în blocuri de un octet (în Pentium această cifră este de octeți, în UltraSPARC III - octeți) Există mai multe opțiuni pentru liniile de control (sunt descrise mai jos), dar diferența cea mai evidentă față de Pentium și UltraSPARC, care sunt procesoare dedicate, este prezența a de linii I/O în patru grupuri ( biți fiecare) Fiecare dintre liniile I/O poate fi conectată la un buton, comutator, LED sau orice alt control utilizat în dispozitivele electronice, organizând astfel fluxurile de date de intrare și ieșire De exemplu, dacă microprocesorul este instalat într-un ceas cu alarmă, atunci toate butoanele și comutatoarele sale sunt conectate la diferite linii I/O și un număr de linii controlează citirile afișate Astfel, toate (sau aproape toate) funcțiile ceasului cu alarmă sunt sub control software și nu este nevoie de circuite logice discrete scumpe Pinout-ul chipului este prezentat în fig Memoria internă implicită este de KB (sau KB pe ) Dacă această cantitate este insuficientă, memoria poate fi extinsă prin conectarea unui modul suplimentar cu o capacitate de până la KB prin intermediul magistralei Primele șapte semnale prezentate în partea stângă a Fig , sunt folosite pentru a se conecta la memoria externă, dacă există Primul semnal, A, conține linii de adresă care se adresează unui octet de memorie externă pentru citire sau scriere Opt linii D sunt folosite pentru transmiterea datelor Orez Pinout cip Exemple de anvelope Cele opt linii de adrese de ordin inferior sunt partajate cu aceiași pini ca și liniile de date, reducând numărul total de pini Când se efectuează o tranzacție cu magistrala, adresa (în timpul primului ciclu) și datele (în timpul ciclurilor ulterioare) sunt transferate prin acești pini Când utilizați memorie externă, indică operațiunile de citire și scriere a memoriei prin setarea semnalelor RD și, respectiv, WR Prezența memoriei externe necesită un semnal ALE (Address Latch Enable) Prin afirmarea acestui semnal, CPU verifică dacă adresa este corectă Memoria externă, folosind acest semnal, pune de obicei zăvoare pe liniile de adresă, care după un timp scurt sunt eliberate și vă permit să continuați transferul de date prin pini Semnalele PSEN și EA# sunt, de asemenea, legate de memoria externă Semnalul PSEN (Program Store Enable) este setat dacă procesorul intenționează să citească date din memoria programului De obicei se corelează cu semnalul de memorie OE (vezi Figura ) Semnalul EA# (Acces extern - acces la memoria externă) este de obicei trimis fie ca zero, fie ca unu; dar în orice caz, sensul său în fiecare caz este neschimbat În cazul unuia, se folosește memoria internă de KB pentru a procesa adrese din intervalul specificat ( KB în modelul ), iar pentru adresele rămase se folosește memoria externă În cazul zero, toate adresele sunt procesate în memoria externă, iar memoria internă rămâne inactivă În modelele și , din cauza lipsei de memorie încorporată, semnalul EA# ar trebui să fie setat doar la zero Două linii de cronometru asigură transferul de date de la temporizatoarele externe la procesor Două linii de întrerupere permit două dispozitive externe să solicite întreruperi ale procesorului Liniile TXD și RXD oferă I/O seriale cu un terminal sau modem În cele din urmă, linia RST permite utilizatorilor și dispozitivelor externe să repornească De obicei, această linie este semnalată în cazul unei defecțiuni care necesită o repornire a sistemului Deci, procesorul este similar cu majoritatea celorlalte procesoare pe biți, iar singura sa caracteristică este prezența liniilor I/O seriale de astfel de linii sunt combinate în porturi prezentate în partea dreaptă a fig Toate liniile sunt bidirecționale, iar operațiunile de citire și scriere prin ele sunt efectuate sub control software Așa interacționează procesorul cu mediul în cele mai multe cazuri, iar acesta este ceea ce îl face extrem de util - funcțiile procesor, memorie și I/O sunt implementate pe același cip Exemple de anvelope Autobuzele conectează sistemul informatic într-un singur întreg În această secțiune, vom analiza câteva exemple de autobuze: ISA, PCI și USB Autobuzul ISA este o versiune ușor îmbunătățită a magistralei IBM PC, prima magistrală pentru calculatoarele personale IBM Din motive de compatibilitate, a fost instalat în toate computerele personale în urmă cu câțiva ani Capitolul Nivel logic digital Calculatoare Intel, dar ulterior Intel și Microsoft au convenit să nu mai susțină acest lucru În orice caz, computerele cu o magistrală ISA care nu sunt prea "vechi" conțin întotdeauna o altă magistrală care este mai rapidă decât ISA Aceasta este magistrala PCI Este mai lat decât ISA și rulează la o viteză mai mare de ceas Prin urmare, transmite mai multe date într-o secundă decât ISA În majoritatea PC-urilor moderne, ea este cea care preia sarcina principală, deși recent rolul magistralelor USB a devenit din ce în ce mai vizibil, utilizate ca instrument de intrare/ieșire pentru dispozitivele periferice cu viteză redusă (cum ar fi șoarecii și tastaturile) În secțiunile următoare, vom analiza pe rând fiecare dintre aceste anvelope Autobuz ISA Autobuzul IBM PC a fost un standard neoficial pentru sistemele cu procesor , deoarece aproape toți producătorii de clone l-au copiat pentru a putea folosi carduri I/O de la diferiți producători în sistemele lor Autobuzul conținea de linii de semnal, dintre ele pentru adrese de memorie, pentru date și câte una pentru citirea informațiilor din memorie, scrierea informațiilor în memorie, citirea de la un dispozitiv I/O și scrierea pe un dispozitiv I/O Au existat și semnale pentru solicitarea și gestionarea întreruperilor, precum și pentru accesul direct la memorie Anvelopa era foarte primitivă Autobuzul IBM PC a fost încorporat în placa de bază a unui computer personal Pe placă erau mai mulți conectori, aflați la o distanță de cm unul de celălalt În conectori au fost introduse diverse plăci Plăcile aveau pini placați cu aur ( pe fiecare parte) care se potrivesc fizic sub conectori Prin intermediul acestora s-a realizat contact electric cu conectorii Când IBM dezvolta computerul PC AT cu procesorul , a întâmpinat unele dificultăți Pe de o parte, dacă compania a dezvoltat o magistrală complet nouă pe biți, mulți potențiali cumpărători nu ar cumpăra acest computer, deoarece niciuna dintre cardurile de înlocuire fabricate de alte companii nu s-ar potrivi noului aparat Pe de altă parte, dacă compania ar decide să păstreze vechea magistrală cu de linii de adresă și linii de date, atunci noul procesor nu și-ar putea realiza toate capacitățile (de exemplu, capacitatea de a accesa MB de memorie și de a transfera) cuvinte pe biți) Ca urmare, s-a decis îmbunătățirea anvelopei vechi Plăcile plug-in pentru computerele personale conțineau un conector de margine ( de pini), dar acest conector de margine nu a rulat pe toată lungimea plăcii Prin urmare, pe placă a fost plasat un alt conector de margine, adiacent celui principal Circuitele PC/AT au fost proiectate astfel încât să poată fi conectate ambele tipuri de plăci Pe fig arată magistrala PC / AT Al doilea conector de margine al magistralei PC/AT conține de linii Dintre acestea, sunt pentru linii de adrese suplimentare, linii de informații, linii de întrerupere, canale de acces direct la memorie, precum și pentru alimentare și masă Exemple de anvelope Liniile rămase sunt concepute pentru a compensa diferența dintre transmisiile pe biți și rânduri Orez Autobuzul PC/AT combină anvelopele vechi și noi Când IBM a lansat seria de calculatoare PS/ , era timpul să începem din nou dezvoltarea autobuzului Pe de o parte, această decizie s-a datorat unor motive pur tehnice (autobuzul RS era deja depășit la acel moment) Dar, pe de altă parte, a fost cauzată de dorința de a "pune în loc" companiile care produceau clone, care la acea vreme au inundat piața calculatoarelor Prin urmare, computerele PS/ de gamă înaltă și medie au fost echipate cu o magistrală MCA (Arhitectura MicroChannel) complet nouă, care a fost protejată de brevete Industria calculatoarelor a răspuns la această mișcare prin introducerea propriului standard, magistrala Industry Standard Architecture (ISA), care este în esență o magistrală PC/AT care rulează la , MHz Avantajul acestei abordări este că menține compatibilitatea cu mașinile și plăcile existente Rețineți că acest standard se bazează pe un autobuz dezvoltat de IBM IBM a acordat odată fără gânduri drepturile de a produce acest autobuz multor companii, astfel încât cât mai mulți producători să poată produce plăci pentru calculatoarele IBM Cu toate acestea, ulterior, IBM a trebuit să regrete foarte mult acest lucru Autobuzul a fost folosit până la un timp în toate computerele personale cu procesor Intel, deși de obicei instalau unul sau mai multe alte autobuze în plus față de acesta Capitolul Nivel logic digital Autobuzul ISA a fost extins ulterior la de biți Are câteva caracteristici noi (de exemplu, posibilitatea de procesare paralelă) Această magistrală se numește EISA (Extended Industry Standard Architecture) magistrala PCI La primele PC-uri IBM, majoritatea aplicațiilor erau bazate pe text Odată cu apariția Windows, interfețele grafice cu utilizatorul au intrat treptat în uz Niciuna dintre aceste aplicații nu pune prea mult stres pe magistrala ISA Cu toate acestea, de-a lungul timpului, au apărut multe aplicații diferite, inclusiv jocuri care necesită videoclipuri pe ecran complet, iar situația s-a schimbat dramatic Hai să facem niște calcule mici Luați în considerare un monitor de x cu o ieșire de imagine color în mișcare ( octeți/pixel) O imagine de pe ecran conține , MB de date Redarea în mișcare lină necesită de cadre pe secundă și, prin urmare, rata de date trebuie să fie de , MB/s În realitate, situația este mult mai gravă, deoarece pentru a transfera o imagine, datele trebuie să fie transferate de pe un hard disk, CD sau DVD printr-un autobuz în memorie Apoi datele trebuie să ajungă la adaptorul grafic (tot prin magistrală) Astfel, numai pentru transmisia video, lățimea de bandă a magistralei ar trebui să fie de MB/s Totuși, computerul are și o unitate centrală de procesare și alte dispozitive care trebuie să folosească și magistrala, astfel încât debitul trebuie să fie și mai mare Frecvența maximă de transfer de date a magistralei ISA este de , MHz Este capabil să transfere doi octeți pe ciclu, astfel încât debitul său maxim este de , MB/s Autobuzul EISA poate transfera octeți pe ciclu Lățimea de bandă ajunge la , MB/s Este clar că niciunul dintre ele nu este complet în conformitate cu ceea ce este necesar pentru videoclipurile pe ecran complet În , Intel a dezvoltat o nouă magistrală cu lățime de bandă mult mai mare decât magistrala EISA Această magistrală a fost numită PCI (Peripheral Component Interconnect - interacțiunea componentelor periferice) Intel a brevetat magistrala PCI și a făcut publice toate brevetele, astfel încât orice companie să poată produce periferice pentru acest autobuz fără nicio plată pentru dreptul de utilizare a brevetului Intel a format, de asemenea, un consorțiu industrial, PCI Special Interest Group, pentru a îmbunătăți în continuare magistrala PCI Toate aceste activități au dus la faptul că magistrala PCI a devenit extrem de populară Practic, fiecare computer Intel (începând cu Pentium), precum și multe alte computere, au o magistrală PCI Chiar și Sun a lansat o versiune a UltraSPARC (computer UltraSPARC III) care utilizează magistrala PCI Busul PCI este descris în detaliu în literatură [ , ] Prima magistrală PCI a transmis de biți pe ciclu și a funcționat la o frecvență de MHz (timp de ciclu - ns), debitul total a fost de MB / s În a apărut magistrala PCI , iar în , magistrala PCI Bus PCI sub Exemple de anvelope este valabil pentru computerele portabile (unde este necesară economisirea bateriei) În final, am reușit să obținem o magistrală PCI care funcționează la o frecvență de MHz, este capabilă să transmită de biți pe ciclu, iar debitul său total este de MB/s Cu această performanță, videoclipul pe ecran complet este destul de realizabil (presupunând că discul și alte dispozitive din sistem își fac treaba) În orice caz, magistrala PCI nu este "gâtul de sticlă" al sistemului Deși MB/s este o rată de transfer de date destul de mare, există încă câteva probleme aici În primul rând, acest lucru nu este suficient pentru magistrala de memorie În al doilea rând, magistrala PCI este incompatibilă cu toate plăcile ISA mai vechi Din acest motiv, Intel a ales să proiecteze computere cu trei sau mai multe magistrale, așa cum se arată în Figura Aici vedem că CPU poate comunica cu memoria principală printr-o magistrală de memorie specială, iar magistrala ISA poate fi conectată la magistrala PCI O astfel de arhitectură în anii a îndeplinit toate cerințele moderne la acea vreme și, prin urmare, a fost folosită în majoritatea sistemelor Cache autobuz Autobuz de memorie L cache /L autobuz local CPU magistrala PCI SCSI USB Podul ISA Tastatură mouse - unitate IDE Adaptor grafic Monitorizați Autobuz ISA Modem Placă de sunet Imprimantă Orez Arhitectura unui sistem tipic Pentium de generație timpurie (Grosimea liniilor care indică un autobuz are scopul de a indica capacitatea acestuia Cu cât linia este mai groasă, cu atât capacitatea este mai mare ) -Memoria principala Slot PCI gratuit Slot ISA gratuit Componentele cheie ale acestei arhitecturi sunt punțile dintre autobuze (aceste microcircuite sunt fabricate de Intel - de unde și interesul pentru proiect) Puntea PCI conectează CPU, memoria și magistrala PCI Pod Capitolul Nivel logic digital ISA conectează magistrala PCI la magistrala ISA și acceptă, de asemenea, una sau două unități IDE Aproape toate sistemele Pentium vin cu unul sau mai multe sloturi PCI libere pentru conectarea perifericelor suplimentare de mare viteză și cu unul sau mai multe sloturi ISA pentru conectarea perifericelor de viteză redusă Avantajul sistemului prezentat în fig este că magistrala dintre CPU și memorie are o lățime de bandă mare, magistrala PCI are, de asemenea, o lățime de bandă mare și este bine potrivită pentru interacțiunea cu periferice de mare viteză (unități SCSI, adaptoare grafice etc ), și atunci când poate încă utilizați plăci ISA mai vechi Figura prezintă și magistrala USB, despre care vom discuta mai târziu în acest capitol Ar fi bine dacă ar exista un singur tip de placă PCI Din păcate, nu este Plăcile diferă în ceea ce privește consumul de energie, adâncimea de biți și sincronizare Calculatoarele mai vechi folosesc de obicei V, în timp ce cele mai noi folosesc , V, astfel încât magistrala PCI le acceptă pe ambele Conectorii sunt la fel (se deosebesc doar prin două mici inserții din plastic care nu vă permit să introduceți o placă de V într-o magistrală PCI de , V și invers) Din fericire, există plăci universale care suportă ambele tensiuni și care pot fi introduse în orice slot Plăcile diferă nu numai prin tensiune, ci și prin adâncimea de biți Există două tipuri de carduri: pe de biți și pe de biți Plăcile pe de biți conțin de pini; Plăcile pe de biți conțin aceiași de pini plus de pini suplimentari, similar modului în care magistrala IBM PC a fost extinsă la biți (vezi Figura ) O magistrală PCI care acceptă plăci pe de biți poate suporta și plăci pe de biți, dar inversul nu este adevărat În cele din urmă, magistralele PCI și plăcile aferente pot funcționa fie la MHz, fie la MHz În ambele cazuri, contactele sunt identice Diferența este că unul dintre pini este conectat fie la sursa de alimentare, fie la masă Până la sfârșitul anilor , autobuzul ISA a fost complet îngropat de participanții de pe piață, iar sprijinul său nu mai era prevăzut în sisteme noi Datorită rezoluției din ce în ce mai mare a ecranului (atingând x pixeli), precum și a cererii de video pe tot ecranul la o rată de cadre standard, relevantă în special în jocurile interactive, Intel a dezvoltat o nouă magistrală dedicată exclusiv comunicării cu adaptorul grafic Această magistrală se numește AGP (Accelerated Graphics Port) Prima sa versiune, AGP , a rulat la MB/s, iar această valoare a fost luată ca x Lipsa vitezei (față de PCI) a fost compensată de o specializare îngustă în managementul adaptorului grafic Ulterior, au fost dezvoltate noi versiuni ale autobuzului - în special, AGP funcționează la o viteză de , GB / s ( x) Dispunerea autobuzului într-un sistem modern Pentium este ilustrată în Fig , În acest sistem, poziția centrală este ocupată de puntea dintre anvelope Conectează cele cinci componente principale ale sistemului: procesor, memorie, adaptor grafic, controler ATARI și magistrală PCI În unele cazuri, alimentează și NIC-uri Ethernet și alte dispozitive de mare viteză Dispozitivele care funcționează la viteze mai mici sunt conectate la magistrala PCI Exemple de anvelope Orez , Dispunerea autobuzului într-un sistem modern Pentium Conform structurii sale interne, puntea este împărțită în două părți: puntea de memorie și puntea I/O Puntea de memorie conectează procesorul la memorie și adaptorul grafic Puntea I/O conectează controlerul ATAI, magistrala PCI și (dacă este necesar) alte dispozitive I/O de mare viteză între ele Datele dintre aceste două punți sunt transmise la o viteză foarte mare Autobuzele PCI sunt sincrone, la fel ca toate magistralele PC care datează de la primul PC IBM Toate tranzacțiile de pe magistrala PCI sunt între master și slave Pentru a nu crește numărul de pini de pe placă, liniile de adresă și informații sunt combinate În același timp, de pini sunt suficienți pentru întregul set de semnale de adresă și informații, chiar dacă PCI funcționează cu adrese pe de biți și date pe de biți Ieșirile combinate de adresă și informații funcționează după cum urmează Când este citită în timpul primului ciclu, șoferul transferă adresa către autobuz În timpul celui de-al doilea ciclu, masterul elimină adresa și magistrala este comutată astfel încât slave să o poată utiliza În timpul celui de-al treilea ciclu, slave emite datele solicitate Când scrieți, magistrala nu trebuie să comute, deoarece șoferul îi transmite atât adresa, cât și datele Cu toate acestea, tranzacția minimă durează trei cicluri Dacă dispozitivul slave nu poate răspunde în trei cicluri, atunci se intră în modul de așteptare Permis Capitolul Nivel logic digital transferuri de blocuri de dimensiuni nelimitate, precum și alte tipuri de cicluri de autobuz Arbitrajul magistralei PCI Pentru a transmite orice semnal pe magistrala PCI, dispozitivul trebuie mai întâi să obțină acces la acesta Busul PCI este controlat de un arbitru centralizat, așa cum se arată în Fig , În cele mai multe cazuri, arbitrul de autobuz este încorporat într-unul dintre podurile de autobuz Există două linii speciale de la fiecare dispozitiv PCI la arbitru Unul dintre ele (REQ#) este folosit pentru a solicita magistrala, iar al doilea (GNT#) este folosit pentru a obține permisiunea de a accesa magistrala Orez , Autobuzul PCI are un arbitru centralizat Pentru a face o cerere de acces la magistrală, dispozitivul PCI (inclusiv CPU) setează semnalul REQ# și așteaptă până când arbitrul setează semnalul GNT# Dacă arbitrul setează semnalul GNT#, atunci dispozitivul poate folosi magistrala în următorul ciclu Algoritmul folosit de arbitru nu depinde de caracteristicile tehnice ale magistralei PCI Arbitrajul în cerc, arbitrajul prioritar și alte scheme de arbitraj sunt permise Un arbitru bun trebuie să fie corect pentru a nu face ca dispozitivele individuale să aștepte de veacuri Autobuzul este furnizat pentru o singură tranzacție, deși durata acestei tranzacții este teoretic arbitrară Dacă un dispozitiv trebuie să comite o a doua tranzacție și niciun alt dispozitiv nu solicită magistrala, acesta poate prelua din nou magistrala, deși de obicei este necesar să se introducă o buclă goală între tranzacții Cu toate acestea, în circumstanțe speciale (în absența unei dispute pentru accesul la magistrală), un dispozitiv poate face tranzacții consecutive fără cicluri de inactivitate între ele Dacă dispozitivul master efectuează un transfer foarte lung și un alt dispozitiv a emis o cerere de acces la magistrală, arbitrul poate șterge linia GNT# Se presupune că driverul monitorizează linia GNT# Dacă semnalul este șters, dispozitivul trebuie să elibereze magistrala în următorul ciclu Un astfel de sistem permite transferuri foarte lungi (ceea ce este destul de rațional) fără nicio dispută pentru accesul la autobuz, dar răspunde rapid și la solicitările de magistrală de la alte dispozitive Exemple de anvelope Semnale magistrală PCI Busul PCI acceptă un număr de semnale obligatorii (Tabelul ) și un număr de semnale opționale (Tabelul ) Pinii rămași sunt folosiți pentru alimentare, împământare și o varietate de semnale aferente Coloanele Master și Slave indică ce dispozitiv setează semnalul într-o tranzacție normală Dacă semnalul este setat de un alt dispozitiv (de ex CLK), ambele coloane sunt lăsate necompletate Tabelul - Semnale obligatorii de magistrală PCI Semnal Număr de linii Master Slave Comentariu CLK generator de ceas ( MHz sau MHz) AD Da Da Adresă și linii de informații combinate PAR Da Bit de paritate pentru adresa sau date C/BE# Da În primul rând, o comandă către magistrală, în al doilea rând, un bitmap care indică ce octeți din cuvânt ar trebui să fie citiți (sau scrieți) FRAME# Da Indică faptul că semnalele AD și C/BE sunt setate IRDY# DA Când este citit, înseamnă că masterul este gata să primească date; la scriere - că datele sunt în magistrală IDSEL Da Citiți spațiul de configurare DEVSEL# Da Slavul și-a recunoscut adresa și așteaptă un semnal TRDY# Da Când citiți, înseamnă că datele sunt pe liniile AD; la scriere - că dispozitivul slave este pregătit să primească date STOP# Da Dispozitivul slave solicită o întrerupere imediată a tranzacției curente PERR# Eroare de paritate a datelor detectată SERR# Paritatea adresei sau eroarea de sistem a fost detectată REQ# Arbitraj autobuz - Solicitare acces autobuz GNT# Arbitraj pentru autobuze - Grant autobuz RST# Reporniți sistemul și toate dispozitivele Capitolul Nivel logic digital Tabelul Semnale opționale de magistrală PCI Semnal Număr de linii Master Slave Comentariu REQ # Da Solicitare pentru o tranzacție pe de biți ACK # Da Activați tranzacția pe de biți AD Da de biți suplimentari de adresă sau date PAR Da Paritate pentru de biți suplimentari de adresă sau date C/BE# Da biți suplimentari pentru a indica ce octeți ai cuvântului să citească (sau să scrie) BLOCARE Da SBO# Pe sistemele multiprocesor, accesarea memoriei cache a altui procesor SDONE În sistemele multiprocesor, semnalați sfârșitul monitorizării INTx Solicitare de întrerupere Semnale de testare JTAG IEEE JTAG M EN Semnalul este conectat la sursa de alimentare sau la masă ( MHz sau MHz) Acum să ne uităm la fiecare semnal de pe magistrala PCI separat Să începem cu semnalele necesare ( de biți) și apoi să trecem la semnalele opționale ( de biți) Semnalul CLK pornește autobuzul Majoritatea semnalelor coincid cu el în timp Spre deosebire de magistrala ISA, în magistrala PCI, o tranzacție începe la căderea semnalului CLK, adică nu la începutul ciclului, ci la mijloc Semnalele AD (există ) sunt necesare pentru adrese și date (pentru transmisii pe de biți) De obicei, adresa este setată în timpul primului ciclu, iar datele în timpul celui de-al treilea Semnalul PAR este bitul de paritate pentru semnalul AD Semnalul C/BE# are două funcții În timpul primului ciclu, acesta conține o comandă (citește un cuvânt, citește bloc etc ) În timpul celui de-al doilea ciclu, acesta conține o matrice de biți care arată ce octeți ai cuvântului de de biți sunt validi Folosind semnalul C/BE#, se pot citi , sau octeți dintr-un cuvânt, precum și întregul cuvânt Semnalul FRAME# este setat de master pentru a începe o tranzacție Acest semnal îi spune slave că adresa și comenzile sunt valabile în prezent Când citiți în același timp cu semnalul FRAME#, semnalul IRDY# este setat Raportează că dispozitivul principal Exemple de anvelope gata să primească date La scriere, semnalul IRDY# este setat ulterior, când datele au fost deja transferate pe magistrală Semnalul IDSEL se datorează faptului că fiecare dispozitiv PCI trebuie să aibă un spațiu de configurare de de octeți pe care îl pot citi și alte dispozitive (prin setarea semnalului IDSEL) Acest spațiu de configurare conține caracteristicile dispozitivului Pe unele sisteme de operare, Plug and Play (PnP) folosește acest spațiu pentru a afla ce dispozitive sunt conectate la magistrală Acum luați în considerare semnalele care sunt setate de dispozitivul slave Semnalul DEVSEL# înseamnă că dispozitivul slave și-a recunoscut adresa pe liniile AD și este gata să participe la tranzacție Dacă semnalul DEVSEL# nu este primit pentru o anumită perioadă de timp, dispozitivul principal presupune că dispozitivul slave către care este direcționat apelul este fie absent, fie defect Următorul semnal este TRDY# Sclavul său se setează pe citire pentru a indica faptul că datele sunt pe liniile AD și pe scriere pentru a indica că este gata să primească date Următoarele trei semnale sunt necesare pentru raportarea erorilor Unul dintre ele, semnalul STOP#, este setat de slave dacă ceva nu merge bine și trebuie să anuleze tranzacția curentă Următorul semnal, PERR#, este utilizat pentru a raporta o eroare de paritate în datele din ciclul anterior Pentru citire, acest semnal este setat de dispozitivul master, pentru scriere, de dispozitivul slave Dispozitivul care primește acest semnal trebuie să ia măsurile necesare În cele din urmă, semnalul SERR# este utilizat pentru a raporta erorile de adresă și de sistem Semnalele REQ# și GNT# sunt pentru arbitrajul magistralei Ele sunt setate nu de dispozitivul care este maestru în acest moment, ci de cel care trebuie să devină maestru Semnalul obligatoriu final, RST#, este folosit pentru a reporni sistemul, care apare fie dacă utilizatorul apasă butonul RESET, fie dacă un dispozitiv de sistem întâlnește o eroare fatală După ce acest semnal este setat, computerul repornește Să trecem la semnalele opționale, dintre care majoritatea sunt legate de extinderea adâncimii de biți de la la de biți Semnalele REQ # și ACK # permit masterului să ceară permisiunea de a executa o tranzacție pe de biți și ca slave să accepte tranzacția Semnalele AD, PAR și C/BE# sunt extensii ale semnalelor corespunzătoare pe de biți Următoarele trei semnale nu sunt legate de trecerea de la la de biți Sunt utilizate în sistemele multiprocesor Nu toate plăcile PCI acceptă aceste sisteme, deci aceste semnale sunt opționale Semnalul LOCK vă permite să blocați magistrala pentru tranzacții concurente Următoarele două semnale sunt legate de faza de urmărire, ceea ce vă permite să păstrați cache-urile diferitelor procesoare consistente Semnalele INTx sunt necesare pentru a solicita întreruperi Placa PCI poate conține până la patru dispozitive logice, fiecare cu propria sa linie Capitolul Nivel logic digital cerere de întrerupere Semnalele JTAG sunt pentru procedura de testare IEEE JTAG În cele din urmă, semnalul M EN este legat fie de sursa de alimentare, fie de masă, ceea ce determină frecvența ceasului Nu ar trebui să se schimbe în timp ce sistemul rulează Tranzacții pe magistrala PCI Busul PCI este de fapt foarte simplu Pentru a înțelege mai bine acest lucru, luați în considerare diagrama de timp din Fig , Aici vedem o tranzacție de citire, urmată de o buclă goală și o tranzacție de scriere, care este efectuată de același driver Orez , Exemple de tranzacții pe de biți pe magistrala PCI În timpul primelor trei cicluri, are loc o operație de citire, apoi un ciclu gol, iar următoarele trei cicluri, o operație de scriere În timpul ciclului Tt, pe frontul descendent al semnalului de ceas, șoferul plasează adresa pe liniile AD și comanda pe liniile C/BE# Driverul setează apoi semnalul FRAME# pentru a începe tranzacția În timpul ciclului T , masterul comută magistrala astfel încât dispozitivul slave să o poată utiliza în timpul ciclului T De asemenea, șoferul modifică semnalul C/BE# pentru a indica ce octeți din cuvânt ar trebui să citească În timpul ciclului T , slave afirmă semnalul DEVSEL# Acest semnal îi spune maestrului că sclavul este Exemple de anvelope adresa chilo si merg sa raspund Dispozitivul slave pune, de asemenea, date pe liniile AD și emite semnalul TRDY#, care informează dispozitivul master despre această acțiune Dacă dispozitivul slave nu poate răspunde rapid, nu dezactivează semnalul DEVSEL# indicând prezența acelui dispozitiv, dar nu afirmă semnalul TRDY# până când nu poate trimite date Această procedură introduce una sau mai multe perioade de așteptare În exemplul nostru (ceea ce se poate întâmpla de fapt), următoarea buclă este goală Vedem că în ciclul T același driver inițiază procesul de scriere Mai întâi pune adresa și comanda pe autobuz, ca de obicei În ciclul următor, scoate date Deoarece liniile AD sunt controlate de același dispozitiv, nu este necesar niciun ciclu de comutare În ciclul T , memoria primește date PCI Express Capacitățile magistralei PCI sunt suficiente pentru majoritatea aplicațiilor moderne, dar nevoia de I/O mai rapidă dezorganizează treptat arhitectura internă odată subțire a computerului Figura arată clar că magistrala PCI nu mai este piesa centrală care ține împreună componentele PC-ului Acest rol este acum îndeplinit de puntea dintre anvelope Esența problemei constă în faptul că, în timp, apar tot mai multe dispozitive I/O, ale căror cerințe de performanță nu se potrivesc cu capacitățile magistralei PCI Overclockarea ceasului magistralei este departe de a fi cea mai bună soluție, deoarece nu face decât să exacerbeze deformarea magistralei, diafonia firelor și capacitatea Ori de câte ori apare un dispozitiv nou care este prea rapid pentru magistrala PCI (fie că este un adaptor grafic, un hard disk, un controler de rețea etc ), dezvoltatorii Intel trebuie să creeze un alt port specializat cu care puntea permite acestui dispozitiv să ocolească magistrala PCI Desigur, o astfel de soluție devine din ce în ce mai puțin eficientă cu fiecare precedent Un alt dezavantaj al magistralei PCI este dimensiunile excesive ale plăcilor Sunt greu de incadrat in carcasele calculatoarelor portabile moderne, ca sa nu mai vorbim de modelele de buzunar În același timp, producătorii reduc în mod constant dimensiunea dispozitivelor lor În plus, unii producători intenționează să treacă la un nou aspect al dispozitivelor în carcasele PC-ului - mai precis, plasați procesorul și memoria într-un compartiment închis separat și hard disk-ul în interiorul monitorului Plăcile PCI nu permit realizarea acestor planuri Acum se propun mai multe soluții la aceste probleme, dar, cel mai probabil, câștigătoarea în competiție va fi tehnologia PCI Express, care este promovată activ de Intel În ciuda numelui, nu are aproape nimic de-a face cu magistrala PCI; În plus, nu este deloc o anvelopă Cu toate acestea, marketerii au decis să nu scape de numele "PCI" - din fericire, este pe buzele tuturor Unele PC-uri acceptă deja această tehnologie Să vedem ce este Capitolul Nivel logic digital Arhitectura PCI Express Esența tehnologiei PCI Express este înlocuirea magistralei paralele cu varietatea sa de dispozitive master și slave cu conexiuni seriale punct la punct de mare viteză Această decizie marchează plecarea definitivă de la topologia magistralei implementată în magistralele ISA/EISA/PCI și trecerea la topologia rețelelor locale (în special rețelele Ethernet comutate) Ideea de bază este aceasta: în esență, un PC este un set de cipuri ale unui procesor, memorie și dispozitive I/O care trebuie interconectate Având în vedere această circumstanță, PCI Express acționează ca un comutator universal care conectează cipurile prin canale seriale Configurația standard PCI Express este prezentată în fig , Orez , Aspect standard al sistemului PCI Express După cum puteți vedea din figură, procesorul, memoria și memoria cache sunt conectate la bridge în mod tradițional Noul element aici este comutatorul conectat la punte (uneori este construit direct în cipul de punte) Se stabilește o conexiune punct la punct între fiecare cip de dispozitiv I/O, pe de o parte, și comutator, pe de altă parte Orice astfel de conexiune constă din două legături unidirecționale, câte una în fiecare direcție între dispozitiv și comutator Canalele constau din două fire (semnal și masă), care asigură imunitate ridicată la zgomot în timpul transmisiei de semnal de mare viteză Această arhitectură diferă de cea anterioară prin o mai mare unificare și egalitate a tuturor dispozitivelor Trei puncte principale disting arhitectura PCI Express de arhitectura PCI Am luat în considerare deja două dintre ele - aceasta este prezența unei comunicări centralizate Exemple de anvelope tator, care a înlocuit principiul unei magistrale multi-tap și utilizarea conexiunilor seriale înguste punct-la-punct în loc de o magistrală paralelă largă A treia diferență este mai puțin vizibilă Modelul conceptual pe care se bazează magistrala PCI este că magistrala magistrală instruiește sclavii să citească un cuvânt sau un bloc de mai multe cuvinte PCI Express se bazează pe un principiu diferit, care implică trimiterea de pachete de date de la un dispozitiv la altul Conceptul de pachet format dintr-un antet și o sarcină utilă este împrumutat de la tehnologiile de rețea Antetul conține informații de control, ceea ce înseamnă că nu este nevoie de numeroase semnale de control care joacă un rol important în transmisia prin magistrala PCI Sarcina utilă conține datele transmise direct Astfel, un PC care acceptă tehnologia PCI Express seamănă cu o rețea cu comutare de pachete în miniatură Pe lângă cele mai importante modificări enumerate mai sus, există și unele mai puțin vizibile În special, pachetele folosesc un cod de detectare a erorilor mai fiabil decât cel PCI În plus, lungimea fizică a conexiunii dintre cip și comutator a crescut la cm, fapt pentru care a devenit mai convenabil să se schimbe poziția componentelor sistemului Deoarece un alt comutator poate fi conectat la comutatorul de bază, formând astfel o structură arborescentă, scalabilitatea sistemului este crescută În plus, dispozitivele din PCI Express sunt conectabile la cald, ceea ce înseamnă că pot fi îndepărtate și montate direct în acest proces În cele din urmă, deoarece conectorii seriali sunt mult mai mici decât conectorii PCI mai vechi, nimic nu îi împiedică pe producători să dezvolte dispozitive și computere compacte Astfel, există o respingere decisivă a principiilor magistralei PCI Stiva de protocoale PCI Express Urmând modelul de rețea cu comutare de pachete, tehnologia PCI Express se bazează pe o stivă de protocoale stratificată Un protocol este un set de reguli care definesc mecanismul de interacțiune între două părți În consecință, stiva de protocoale este un sistem ierarhic de protocoale care reglementează diverse aspecte ale interacțiunii la diferite niveluri Să luăm ca exemplu o scrisoare de afaceri Există anumite convenții despre locația și conținutul capului scrisorii, adresa destinatarului, data, forma salutului, corpul scrisorii, semnăturile etc Toate aceste convenții pot fi numite colectiv protocolul de o scrisoare de afaceri În plus, există standarde privind dimensiunea și formatul plicului, amplasarea ștampilei și subtilități similare Aceste două straturi și protocoalele lor respective sunt independente unul de celălalt De exemplu, puteți schimba complet formatul scrisorii, punându-l într-un plic standard și invers Astfel de protocoale stratificate, care permit dezvoltarea modulară cu un nivel ridicat de flexibilitate, au fost utilizate pe scară largă în software-ul de rețea de zeci de ani În tehnologia PCI Express, s-a încercat să le implementeze în hardware-ul "autobuz" Stiva de protocoale PCI Express este prezentată în Fig , a Capitolul Nivel logic digital Nivelul programului Nivelul tranzacției Stratul de legătură Strat fizic I Antet I Sarcină utilă | I Numărul I Titlu | Sarcină utilă | CRC | I Cadrul I Numărul | Titlu | Sarcină utilă | CRC | Cadru | b A Orez , Stiva de protocoale PCI Express (a); format pachet (b) Să luăm în considerare nivelurile în ordine crescătoare Cel mai de jos este stratul fizic Este responsabil pentru transmiterea biților de la emițător la receptor printr-o conexiune punct la punct Fiecare astfel de conexiune constă dintr-una sau mai multe perechi de canale simplex (unidirecționale) În cel mai simplu caz, se alocă câte o pereche pentru fiecare direcție, dar este posibil să existe și , , , sau de perechi Canalele în perechi se numesc benzi Fiecare sens trebuie să aibă același număr de benzi Prima generație oferă rate de transfer de date de , GB/s pentru fiecare direcție, dar după ceva timp această cifră va ajunge probabil la GB/s Spre deosebire de magistralele ISA, EISA și PCI, tehnologia PCI Express nu oferă un generator de ceas Dispozitivele au dreptul de a începe transmisia în orice moment, de îndată ce au ceva de transmis O astfel de libertate, pe de o parte, crește performanța, pe de altă parte, creează o problemă Să presupunem că un este codificat cu + V și un este codificat cu V Dacă primii câțiva octeți sunt zero, de unde știe receptorul că datele îi sunt trimise? Într-adevăr, o secvență de zero biți este greu de distins de un canal inactiv Această problemă este rezolvată cu ajutorul așa-numitei codări de / biți Conform acestei scheme, octet de date reale este codificat cu un caracter de biți Dintre cele de simboluri posibile pe biți, sunt selectate acelea care, datorită unui număr suficient de fronturi fără un generator principal, asigură sincronizarea emițătorului și receptorului de-a lungul limitelor de biți Datorită utilizării codificării pe / biți, lățimea de bandă totală a canalului de , GB/s se restrânge la o lățime de bandă reală de GB/s Stratul de legătură este responsabil pentru transmiterea pachetelor La acest nivel, la antetul și sarcina utilă transmise de la nivelul tranzacției se adaugă un număr de secvență și un cod de corectare a erorilor, așa-numitul CRC (Cyclic Redundancy Check - cyclic redundancy check) Codul CRC este generat prin efectuarea unui algoritm specific pe antet și sarcină utilă La primirea unui pachet, dispozitivul efectuează aceleași calcule asupra antetului și datelor și compară rezultatul cu valoarea specificată în pachet Dacă cele două rezultate se potrivesc, un pachet de validare este trimis înapoi expeditorului inițial În caz contrar, destinatarul face o cerere de retransmitere Astfel, indicatorii de integritate a datelor sunt îmbunătățiți semnificativ în comparație cu magistrala PCI, care nu implementează controlul și retransmisia datelor Exemple de anvelope Pentru a evita supraîncărcarea unui receptor lent cu pachete care provin de la un expeditor rapid, este implementat un mecanism de control al fluxului Acest mecanism se bazează pe eliberarea de către destinatar către expeditor a unui anumit număr de permisiuni de transmitere a pachetelor, în funcție de cantitatea de spațiu liber necesară pentru stocarea acestora După ce a epuizat permisiunile emise anterior, expeditorul trebuie să suspende transmisia și să aștepte noi permise Această schemă, comună în toate rețelele, previne pierderea datelor din cauza unei nepotriviri între vitezele expeditorului și receptorului La nivel de tranzacție, toate operațiunile cu magistrala sunt efectuate De exemplu, pentru a citi un cuvânt din memorie, trebuie efectuate două tranzacții, dintre care una este inițiată de procesorul sau canalul DMA care solicită date, cealaltă de obiectul țintă (furnizorul de date) Cu toate acestea, citirea și scrierea nu sunt singurele operațiuni care sunt efectuate la nivel de tranzacție Acest strat, în special, extinde capacitățile de transfer de pachete furnizate de stratul de legătură Fiecare bandă la nivel de canal este subdivizată în până la opt canale virtuale, fiecare dintre ele transportând un tip de date sau altul La nivel de tranzacție, pachetele sunt marcate în funcție de o clasă de trafic care definește un număr de proprietăți, cum ar fi "prioritate mare", "prioritate scăzută", "fără snooping", "livrare în afara secvenței permisă", etc Prin aranjarea ordinea de procesare a pachetelor, comutatorul, printre altele, se bazează pe informațiile de la markeri Orice tranzacție are loc în unul dintre cele patru spații de adresă: + spațiu de memorie (când se efectuează operații standard de citire și scriere); + spațiu I/O (pentru adresarea registrelor dispozitivului); + spațiu de configurare (pentru inițializarea sistemului etc ); + spațiu pentru mesaje (pentru trimiterea de semnale, întreruperi etc ) Memoria și spațiile I/O sunt similare cu cele tradiționale care sunt implementate în sistemele moderne În spațiul de configurare, este posibilă implementarea diferitelor tipuri de mecanisme, de exemplu, configurația automată (RPP) Spațiul de mesaje își asumă astăzi funcțiile numeroaselor semnale de control Este imposibil să faci fără acest spațiu, deoarece în PCI Express nu există linii de control prevăzute în magistrala PCI Stratul software acționează ca un intermediar între PCI Express și sistemul de operare Printre altele, oferă un mod de emulare a magistralei PCI care vă permite să instalați sisteme de operare vechi în computerele echipate cu PCI Express fără nicio modificare Desigur, atunci când lucrați în astfel de condiții, este imposibil să implementați toate caracteristicile PCI Express, dar compatibilitatea inversă este o măsură necesară - cel puțin până când toate sistemele de operare acceptă pe deplin PCI Express Experiența arată că acest proces va dura mult timp Fluxul de informații tipic pentru PCI Express este ilustrat în fig b Comanda care ajunge la nivelul programului este transmisă la nivel Capitolul Nivel logic digital arborele tranzacției în care se formează antetul și sarcina utilă Apoi aceste componente sunt trimise la stratul de legătură, la care numărul de secvență este setat în antetul pachetului, iar codul CRC este setat în coadă Acest pachet extins este apoi trecut la stratul fizic, unde parametrii de cadru sunt adăugați la ambele capete, iar pachetul fizic rezultat este transmis de la emițător la receptor Pe partea destinatarului, are loc procesul invers - antetul și coada cadrului la nivel de legătură sunt eliminate, iar rezultatul este transferat la nivelul tranzacției Schema, conform căreia se adaugă date suplimentare la setul inițial la fiecare nivel ulterior al stivei de protocoale, a fost folosită în rețelele de calculatoare de foarte mult timp și cu succes Principala diferență dintre tehnologiile de rețea și PCI Express este că, în primul caz, codul care operează la diferite niveluri ale stivei este aproape întotdeauna software și este controlat de sistemul de operare În PCI Express, pe de altă parte, operațiunile la toate nivelurile sunt implementate în hardware Structura PCI Express este destul de complexă Descrierea sa detaliată este disponibilă în [ , ] Autobuz USB Autobuzele PCI și PCI Express sunt foarte potrivite pentru conectarea perifericelor de mare viteză, dar utilizarea interfeței PCI pentru dispozitive I/O cu viteză redusă (cum ar fi șoarecii și tastaturile) ar fi prea costisitoare Inițial, fiecare dispozitiv I/O standard era conectat la computer într-un mod special, în timp ce sloturile ISA și PCI gratuite au fost folosite pentru a adăuga dispozitive noi Din păcate, această schemă are câteva dezavantaje De exemplu, fiecare dispozitiv I/O nou vine adesea cu propriul card ISA sau PCI Utilizatorul trebuie să seteze el însuși comutatoarele și jumperii de pe placă și să se asigure că placa configurată nu intră în conflict cu alte plăci Apoi utilizatorul trebuie să deschidă unitatea de sistem, să introducă cu atenție placa, să închidă unitatea de sistem și să pornească computerul Pentru mulți, acest proces este foarte complicat și duce adesea la erori În plus, numărul de sloturi ISA și PCI este foarte mic (de obicei două sau trei) Plăcile Plug and Play elimină nevoia de comutatoare, dar utilizatorul trebuie să deschidă computerul și să introducă placa În plus, numărul de sloturi de autobuz este limitat În , șapte companii (Compaq, DEC, IBM, Intel, Microsoft, NEC și Northern Telecom) s-au reunit pentru a dezvolta o magistrală care era potrivită în mod optim pentru conectarea dispozitivelor cu viteză redusă Apoi li s-au alăturat sute de alte companii Rezultatul muncii lor a fost magistrala USB (Universal Serial Bus), care este acum utilizat pe scară largă în computerele personale [ , ] Câteva dintre cerințele care au stat inițial la baza proiectului: + utilizatorii nu trebuie să instaleze comutatoare și jumperi pe plăci și dispozitive; Exemple de anvelope + utilizatorii nu trebuie să deschidă computerul pentru a instala noi dispozitive I/O; + ar trebui să existe un singur tip de cablu potrivit pentru conectarea tuturor dispozitivelor; + Dispozitivele I/O trebuie alimentate prin cablu; + ar trebui să fie posibil să se conecteze până la de dispozitive la un computer; + sistemul trebuie să suporte dispozitive în timp real (ex dispozitive de sunet, telefon); + ar trebui să fie posibilă instalarea dispozitivelor în timp ce computerul rulează; + nu ar trebui să fie nevoie să reporniți computerul după instalarea unui dispozitiv nou; + Producția unei noi magistrale și a dispozitivelor I/O pentru aceasta nu ar trebui să fie costisitoare Busul USB îndeplinește toate aceste condiții Este conceput pentru dispozitive cu viteză redusă (tastaturi, șoareci, camere foto, scanere, telefoane digitale etc ) Lățimea de bandă totală a primei versiuni a magistralei (USB ) este de , MB/s Versiunea rulează la MB/s, ceea ce este suficient de bun pentru imprimante, camere digitale și multe alte dispozitive Limita a fost aleasă pentru a reduce costul anvelopei Busul USB constă dintr-un hub rădăcină care se conectează la conectorul magistralei principale (vezi Figura ) Acest hub rădăcină (denumit adesea hub rădăcină) conține conectori pentru cabluri care pot fi conectate la dispozitive I/O sau hub-uri suplimentare pentru a crește numărul de conectori Astfel, topologia magistralei USB este un arbore înrădăcinat în hub-ul rădăcină, care se află în interiorul computerului Conectorii de cablu de pe partea dispozitivului sunt diferiți de conectorii de pe partea de hub, astfel încât utilizatorul să nu conecteze accidental cablul cu cealaltă parte Cablul este format din patru fire: două dintre ele sunt pentru transmiterea datelor, unul pentru alimentare (+ V) și unul pentru masă Sistemul transmite cu o schimbare de tensiune și fără schimbare de tensiune, astfel încât o secvență lungă de biți zero generează un flux de impulsuri regulate Când este conectat un nou dispozitiv I/O, hub-ul rădăcină detectează acest fapt și închide sistemul de operare Sistemul de operare solicită apoi un nou dispozitiv, dându-și seama ce este și de câtă lățime de bandă a magistralei necesită Dacă sistemul de operare decide că există suficientă lățime de bandă pentru acest dispozitiv, îi atribuie o adresă unică ( - ) și încarcă această adresă și alte informații în registrele de configurare din cadrul dispozitivului Astfel, noi dispozitive pot fi conectate din mers fără ca utilizatorul să fie nevoit să instaleze noi carduri ISA sau PCI Plăcile neinițializate încep la adresa , astfel încât să poată fi accesate Multe dispozitive Capitolul Nivel logic digital echipat cu hub-uri de rețea încorporate pentru dispozitive suplimentare De exemplu, un monitor poate conține două hub-uri pentru difuzoarele din dreapta și din stânga Autobuzul USB este o serie de canale între hub-ul rădăcină și dispozitivele I/O Fiecare dispozitiv își poate împărți canalul în până la sub-canale pentru diferite tipuri de date (de exemplu, audio și video) În fiecare canal sau subcanal, datele se mută de la hub-ul rădăcină la dispozitiv și invers Nu există schimb de informații între cele două dispozitive I/O Exact la fiecare milisecundă (± , ms), hub-ul rădăcină trimite un nou cadru pentru a sincroniza toate dispozitivele în timp Cadrul este format din pachete, primul fiind transmis de la hub la dispozitiv Următoarele pachete ale cadrului pot fi transmise în aceeași direcție, sau în direcția opusă (de la dispozitiv la hub) Pe fig arată patru cadre consecutive Aşteptare Cadrul SOF Timp, ms Cadrul SOF SYN PID PAYLOAD CRC Pachetul de date dispozitiv SYN PID PAYLOAD CRC SYN PID PAYLOAD CRC Orez , Hub-ul USB root transmite cadre la fiecare milisecundă Cadrele și nu au activitate, deci conțin doar un pachet SOF (Start of Frame) Acest pachet este întotdeauna trimis la toate dispozitivele Cadrul este o solicitare ordonată (de exemplu, o solicitare este trimisă scanerului pentru a trimite biți din imaginea scanată) Cadrul constă în datele trimise către un dispozitiv (cum ar fi o imprimantă) Busul USB acceptă tipuri de cadre: cadre de control, cadre izocrone, cadre de transfer de date în bloc și cadre de întrerupere Cadrele de control sunt folosite pentru a configura dispozitivele, a trimite comenzi la dispozitive și a interoga starea acestora Cadrele izocrone sunt destinate dispozitivelor în timp real (microfoane, difuzoare și telefoane) care trebuie să primească și să trimită date la intervale de timp egale Întârzierile sunt bine prezise, dar în cazul unei erori, astfel de dispozitive nu retransmit Cadrele de următorul tip sunt utilizate pentru transferuri de volum mare de la și către dispozitive (de exemplu, imprimante) Exemple de anvelope fără cerințele specifice dispozitivelor în timp real În cele din urmă, sunt necesare cadre de acest din urmă tip, deoarece magistrala USB nu acceptă întreruperi De exemplu, pentru a nu declanșa o întrerupere de fiecare dată când este apăsată o tastă, sistemul de operare poate declanșa o întrerupere la fiecare ms și poate "colecta" orice date de apăsare întârziată a tastei Un cadru este format din unul sau mai multe pachete Pachetele pot fi trimise în ambele direcții Există patru tipuri de pachete: jetoane, pachete de date, pachete de confirmare și pachete speciale Tokenurile sunt transmise de la hub la dispozitiv și sunt destinate să controleze sistemul Pachetele SOF, IN și OUT din fig , - markere Pachetul SOF (Start of Frame) este primul din orice cadru, identifică începutul cadrului Dacă nu este necesară nicio acțiune, pachetul SOF este singurul din cadru Pachetul IN este o solicitare Acest pachet necesită ca dispozitivul să furnizeze anumite date Câmpurile din pachetul IN conțin informații despre ce canal este solicitat, iar din aceste informații dispozitivul determină ce date să emită (dacă manipulează mai multe fluxuri de date) Pachetul OUT anunță că va urma transmisia de date pentru dispozitiv Ultimul tip de marcator, SETUP (nu este prezentat în figură), este utilizat în timpul configurării Pe lângă markere, există încă trei tipuri de pachete Acestea sunt pachete de date (utilizate pentru a transfera de octeți de informații în ambele direcții), pachete de confirmare și pachete speciale Formatul pachetului de date (DATA) este prezentat în fig , Acesta constă dintr-un câmp de sincronizare pe biți, un identificator de tip de pachet (PID) de biți, o sarcină utilă și un cod CRC de biți pentru detectarea erorilor Există trei tipuri de pachete de confirmare: ACK (pachetul de date anterior a fost primit corect), NAC (a fost găsită o eroare de cod CRC) și STALL (dispozitivul este ocupat, vă rugăm să așteptați) Acum să ne uităm la Fig , Hub-ul rădăcină trebuie să trimită un cadru la fiecare milisecundă, chiar dacă nu are loc nicio acțiune Cadrele și conțin un singur pachet SOF, ceea ce indică faptul că nu se întâmplă nimic Cadrul este sondaj, deci începe cu pachetele SOF și IN de la computer la dispozitivul I/O, urmate de un pachet de DATE de la dispozitiv la computer Pachetul ACK spune dispozitivului că datele au fost primite fără erori În cazul unei erori, dispozitivul primește un pachet NACK, după care datele sunt retransmise (rețineți că datele izocrone nu sunt retransmise) Cadrul este similar ca structură cu cadrul , dar fluxul de date este de la computer la dispozitiv După ce standardul USB a fost aprobat în sfârșit în , dezvoltatorii au început să creeze următoarea versiune de mare viteză a USB, numită USB Acest standard este în multe privințe similar cu USB și este compatibil cu acesta, totuși, la cele două viteze anterioare se adaugă unul nou - MB/s Toate celelalte modificări, inclusiv implementarea unei noi interfețe între hub-ul rădăcină și controler, nu sunt atât de semnificative Standardul USB a furnizat două interfețe UHCI și ONSI Interfața UHCI (Universal Host Controller Interface - o interfață universală de controler gazdă) a fost dezvoltată de Intel, transferând majoritatea grijilor către programatori (citiți - Capitolul Nivel logic digital pe Microsoft) Programatorii le-au întors favoarea și au lansat interfața ONSI (Orep Host Controller Interface - o interfață deschisă de controler gazdă), punând munca principală pe dezvoltatorii de hardware (a se citi - Intel) În timpul dezvoltării standardului USB , părțile au ajuns la o soluție reciproc acceptabilă prin lansarea unei noi interfețe numită ENCI (Enhanced Host Controller Interface - o interfață îmbunătățită a controlerului gazdă) Deoarece magistrala USB transferă acum date la MB/s, aceasta devine un concurent serios pentru magistrala serială IEEE (FireWire) care operează la MB/s Deși aproape toate sistemele moderne bazate pe Pentium sunt echipate cu USB , standardul , care este susținut de producătorii de electronice de larg consum, nu este în pericol Camerele video, DVD playerele și alte dispozitive electronice sunt susceptibile să suporte pentru o lungă perioadă de timp interfața Acest lucru se datorează faptului că producătorii lor nu sunt dispuși să cheltuiască fonduri semnificative doar pentru a trece la un standard ale cărui avantaje în comparație cu precedentul standard sunt foarte îndoielnice Sunt solidari cu utilizatorii finali, cărora nici nu le place să schimbe standardele Interfețe Un sistem computerizat tipic de dimensiuni mici până la mijlocii constă dintr-un cip de procesor, cipuri de memorie și mai multe controlere I/O Toate aceste microcircuite sunt conectate printr-un autobuz Am acoperit deja memoria, procesoarele și autobuzele Acum este timpul să studiem cipurile I/O Prin aceste microcircuite computerul face schimb de informații cu dispozitive externe cipuri I/O În prezent, există multe cipuri I/O diferite Noi microcipuri apar tot timpul Cele mai comune sunt UART, USART, controlere CRT, controlere de disc și RJU Un UART (Universal Asynchronous Receiver Transmitter) este un cip care poate citi un octet din magistrala de date și poate transmite acel octet bit cu bit pe linia serială către sau de la terminal Viteza cipurilor UART este diferită: de la la bps; lățimea caracterelor de la la biți; , , sau biți de oprire Microcircuitul poate oferi paritate pară sau impară, verificarea poate fi și absentă, totul este controlat de software Cipul USART (Universal Synchronous Asynchronous Receiver Transmitter) poate efectua transmisie sincronă folosind o serie de protocoale De asemenea, acceptă toate funcțiile cipului UART Acum, ca exemplu de microcircuit I/O, luați în considerare interfața paralelă Ryu Interfețe Microcircuite PIO Un exemplu tipic de cip de interfață PYU (Intrare/Ieșire paralelă - intrare-ieșire paralelă) este cipul Intel A (Fig ) Conține de linii I/O și poate interfața cu orice dispozitiv compatibil TTL (de exemplu, tastaturi, comutatoare, indicatoare, imprimante) Programul CPU poate scrie sau pe orice linie sau poate citi starea de intrare a oricărei linii, oferind o mare flexibilitate Cipul Ryu înlocuiește adesea întreaga placă cu cipuri MIS și SIS (în special în sistemele încorporate) CPU poate configura cipul A în diferite moduri prin încărcarea registrelor de stare a chipului; ne vom concentra asupra unora dintre modurile de operare mai simple Vă puteți gândi la acest cip ca fiind trei porturi de biți: A, B și C Un registru de biți este asociat fiecărui port Pentru a configura linii pe port, CPU scrie un număr de biți în registrul corespunzător, iar acel număr de biți apare pe liniile de ieșire și rămâne acolo până când registrul este suprascris Pentru a utiliza un port pentru intrare, procesorul citește pur și simplu registrul corespunzător Alte moduri de operare includ confirmarea comunicării cu dispozitivele externe De exemplu, pentru a trimite date către un dispozitiv, A ar putea trimite date la un port de ieșire și poate aștepta până când dispozitivul semnalează că datele au fost primite și mai multe pot fi trimise Microcircuitul include circuitele logice necesare pentru fixarea unor astfel de semnale și transmiterea lor către procesorul central Vedem în Fig că, în plus față de de pini pentru trei porturi, cipul A conține opt linii conectate direct la magistrala de date, o linie de selecție a elementelor de memorie, linii de citire și scriere, două linii de adresă și o linie pentru resetarea cipului Două linii de adresă vă permit să selectați unul dintre cele patru registre interne, dintre care trei corespund portului A, B și C Al patrulea registru este registrul de stare Determină ce porturi sunt folosite pentru intrare și ce porturi sunt folosite pentru ieșire și îndeplinește și alte funcții De obicei, cele două linii de adresă sunt conectate la cei doi biți cei mai puțin semnificativi ai magistralei de adrese Capitolul Nivel logic digital Decodificarea adresei Până acum, nu ne-am oprit în detaliu asupra modului în care are loc alegerea unui cip de memorie sau a unui dispozitiv I/O Luați în considerare un computer încorporat simplu de biți, constând dintr-o unitate centrală de procesare, o EPROM de K x octeți pentru stocarea programului, o memorie RAM de K x octeți pentru stocarea datelor și un cip PYU Un astfel de sistem mic poate fi construit într-o jucărie ieftină sau într-un dispozitiv simplu ROM-ul obișnuit poate fi folosit în loc de EPROM Cipul Ryu poate fi accesat în unul din două moduri: ca dispozitiv I/O sau ca o bucată de memorie Dacă avem nevoie de un microcircuit ca dispozitiv I/O, trebuie să ne referim la acesta folosind o linie de magistrală externă O altă abordare se numește I/O mapat cu memorie În acest caz, cipul trebuie să aloce octeți de memorie pentru trei porturi și un registru de control Alegerea noastră este oarecum arbitrară Să aruncăm o privire la I/O mapate în memorie, deoarece această abordare ilustrează câteva probleme interesante de asociere Memoria EPROM necesită KB de spațiu de adrese, RAM de asemenea KB, iar cipul Ryu octeți Deoarece spațiul de adrese din exemplul nostru este de K de adrese, trebuie să alegem unde să punem cele trei dispozitive Una dintre opțiunile posibile este prezentată în Fig , EPROM ocupă adrese de până la K, RAM - de la K la K, RYU - octeți înalți ai spațiului de adrese, de la adresele la Din punctul de vedere al programatorului, nu contează ce adrese să folosească, totuși, pentru împerechere are o mare importanță Dacă am accesa RIO prin spațiul I/O, nu am avea nevoie de adrese de memorie (dar am avea nevoie de patru adrese de spațiu I/O) EPROM cu adresa O RAM cu adresa H RIO cu adresa FFFCH Despre K K K K K K K K K K K K K K K K Smochin , Locația EPROM, RAM și RIO în spațiul de K adrese Cu această alocare de adrese, EPROM-ul trebuie accesat utilizând adresa de memorie de biți OOOOOhhhhhhhhh (în binar) Cu alte cuvinte, orice adresă care are cei mai semnificativi cinci biți de intră în zona de memorie până la K, adică în EPROM Astfel, semnalul de selectare EPROM poate fi conectat la un comparator de biți, care va avea întotdeauna una dintre intrările sale conectată la Pentru a obține același rezultat, ar fi mai bine să folosiți o poartă SAU cu cinci intrări conectate la liniile de adresă An prin A Semnalul de ieșire poate fi dacă și numai dacă toate cele cinci linii sunt În acest caz Interfețe ceai, semnalul CS este setat Din păcate, nu există porți SAU cu cinci intrări în seria MIS standard Cu toate acestea, putem folosi o poartă NOR cu opt intrări Prin împământarea celor trei intrări și inversarea ieșirii, putem obține semnalul de care avem nevoie (Fig , a) Autobuz de adrese - Orez , Decodarea adresei complete (a); decodare parțială a adresei (b) Capitolul Nivel logic digital Schemele MIS sunt foarte ieftine, așa că utilizarea nu foarte eficientă a uneia dintre ele este destul de acceptabilă Prin convenție, intrările neutilizate nu sunt prezentate în diagrame Același principiu poate fi aplicat RAM Cu toate acestea, RAM trebuie să răspundă la adrese binare precum ІОООххххххххх, deci este nevoie de un invertor suplimentar (este prezentat în diagramă) Decodificarea adresei cipului RYU este ceva mai complicată, deoarece este accesată folosind patru adrese precum IXX Un posibil circuit care setează semnalul CS numai dacă o adresă de acest tip apare pe magistrala de adrese este prezentat în figură Utilizează două porți NAND cu opt intrări care sunt conectate la o poartă SAU Pentru a construi schema de decodare a adreselor prezentată în Fig , a, sunt necesare șase cipuri MIS: patru cipuri cu opt intrări, o poartă SAU și un cip cu trei invertoare Dacă computerul constă doar dintr-o unitate centrală de procesare, două cipuri de memorie și un RIO, decodarea adreselor poate fi foarte simplificată Faptul este că pentru toate adresele EPROM (și numai pentru EPROM), cel mai semnificativ bit al A este întotdeauna Prin urmare, putem conecta pur și simplu semnalul CS la linia A , așa cum se arată în Fig b Acum decizia de a plasa RAM de la adresa H nu pare atât de arbitrară Rețineți că adrese precum ІОхххххххххххх intră în RAM, deci biți sunt suficienți pentru decodare De asemenea, orice adresă care începe cu un I este o adresă Ryu Logica de decodare completă constă din două porți NAND și un invertor Deoarece un invertor poate fi realizat dintr-o poartă NAND prin legarea a două intrări împreună, o poartă NAND cvadruplă este mai mult decât suficientă Logica ilustrată în fig b, se numește decodare parțială a adreselor, deoarece în acest caz nu sunt folosite adrese complete Cu această decodare, citirea din adresele și De fapt, orice adresă din jumătatea inferioară a spațiului de adrese înseamnă o selecție EPROM Deoarece nu sunt folosite adrese suplimentare, acesta nu este un lucru groaznic, dar atunci când proiectați un computer care ar trebui să fie extins în viitor (în cazul jucăriilor, acest lucru este puțin probabil), decodificarea parțială ar trebui evitată, deoarece limitează semnificativ spațiul de adrese De asemenea, puteți utiliza o altă tehnologie de decodare a adreselor - folosind un decodor (vezi Figura ) Prin conectarea celor trei intrări la cele trei linii de adresă MSB, obținem opt ieșiri care corespund adreselor din primul segment de K, al doilea segment de K și așa mai departe Într-un computer care conține cipuri RAM de K x octeți, decodare completă realizează un astfel de microcircuit Dacă computerul conține cipuri de memorie de K x octeți, un decodor este, de asemenea, suficient pentru decodare, cu condiția ca fiecare cip de memorie să ocupe o zonă separată a spațiului de adrese de K (Amintiți-vă de observația noastră că locația cipurile de memorie și dispozitivele de intrare sunt scoase în interiorul spațiului de adrese contează ) Întrebări și sarcini Rezumatul capitolului Calculatoarele sunt construite din circuite integrate care conțin întrerupătoare minuscule numite porți Porțile comune sunt AND, OR, NAND, NOR și NOT Prin combinarea supapelor individuale, pot fi construite circuite simple Circuitele mai complexe sunt multiplexoarele, demultiplexoarele, codificatoarele, decodoarele, schimbatoarele și ALU-urile Funcțiile booleene arbitrare pot fi programate folosind matricea logică programabilă Dacă sunt necesare multe funcții booleene, matricele logice programabile sunt de obicei mai eficiente decât alte mijloace Legile algebrei booleene sunt folosite pentru a transforma circuitele dintr-o formă în alta În multe cazuri, pot fi create circuite mai economice în acest fel Operațiile aritmetice în calculatoare sunt efectuate de sumatori Un sumator cu un singur bit poate fi construit din două jumătăți de adunare Pentru a construi un adunator de cuvinte pe mai mulți biți, sumatorii completi sunt conectați astfel încât ieșirea de transport a fiecărui sumator să fie transmisă vecinului său din stânga Memoria statică este formată din zăvoare și flip-flops, fiecare dintre acestea putând stoca câte un bit de informații Acestea pot fi combinate pentru a crea flip-flops și zăvoare de opt biți sau memorie gata de utilizare pentru stocarea cuvintelor Există diferite tipuri de memorie: RAM, ROM, PROM, EPROM, EEPROM, memorie flash RAM statică nu trebuie actualizată: stochează informații în timp ce computerul este pornit RAM dinamică, pe de altă parte, trebuie reîmprospătată periodic pentru a preveni pierderea de informații Componentele unui sistem informatic sunt conectate prin autobuze Majoritatea (deși nu toți) pinii unui procesor tipic formează o singură linie de magistrală Liniile de autobuz pot fi împărțite în adresă, informații și control Autobuzele sincrone sunt conduse de un oscilator principal În magistralele asincrone, un sistem complet de strângere de mână este utilizat pentru a coordona funcționarea dispozitivelor master și slave Pentium este un exemplu de procesor modern Sistemele cu un astfel de procesor includ o magistrală de memorie, o magistrală PCI, o magistrală ISA și o magistrală USB Busul PCI poate transmite de biți de informații simultan la o frecvență de MHz Acest lucru este suficient pentru aproape toate dispozitivele periferice, dar nu și pentru memorie Comutatoarele, indicatoarele, imprimantele și multe alte dispozitive I/O pot fi conectate la un computer folosind cipuri I/O (de exemplu, A) Aceste cipuri pot fi opțional făcute parte din spațiul I/O sau parte din spațiul de memorie Accesul la cip poate avea loc prin decodarea totală sau parțială a adresei, în funcție de sarcinile pe care computerul le rezolvă Întrebări și sarcini Un logician intră cu mașina într-un restaurant și spune: "Dă-mi un hamburger sau un hot dog și cartofi prăjiți, te rog " Din păcate, bucătarul nu a terminat șase clase și nu știe (și nu vrea să știe) care dintre cele două operații logice Capitolul Nivel logic digital Și sau SAU are prioritate față de celălalt El consideră că orice interpretare este acceptabilă în acest caz Și care dintre opțiunile de interpretare a acestei afirmații enumerate aici sunt cu adevărat admisibile? (Rețineți că OR este tratat ca SAU EXCLUSIV aici ) ) Doar un hamburger ) Doar un hot dog ) Doar cartofi prajiti ) Hot dog și cartofi prăjiți ) Hamburger și cartofi prăjiți ) Hot dog și hamburger ) Toate trei ) Nimic - logicianul va rămâne flămând pentru că este prea deștept Un misionar care s-a rătăcit în California de Sud s-a oprit la o bifurcație a drumului Știe că în zonă sunt două bande de motocicliști Unul dintre ei spune mereu adevărul, iar celălalt minte mereu Vrea să știe ce drum duce la Disneyland Ce întrebare ar trebui să pună? Folosind tabelul de adevăr, arată că X = (X ȘI Y) SAU (X ȘI NU Y) Există funcții booleene pentru o variabilă și funcții pentru două variabile Câte funcții a trei variabile există? Și din n variabile? Arată cum poate fi implementată funcția AND folosind două porți NAND Folosind multiplexorul cu trei variabile prezentat în fig , implementați o funcție a cărei valoare este dacă și numai dacă un număr impar de intrări este Multiplexorul cu trei variabile prezentat în fig este de fapt capabil să calculeze o funcție arbitrară a patru variabile booleene Descrieți cum se întâmplă acest lucru și desenați o diagramă logică pentru o funcție care evaluează la dacă cuvântul corespunzător rândului din tabelul de adevăr conține un număr par de litere și dacă conține un număr impar de litere (de exemplu, = zero = patru litere − " ; = două = trei litere - ; = șapte = patru litere - ; = treisprezece = zece litere -> ) Sugestie', să numim a patra variabilă de intrare D Apoi opt linii de intrare pot fi conectate la Vcc, masă, D sau D Desenați diagrama logică a unui encoder pe doi biți care conține linii de intrare și de ieșire Una dintre liniile de intrare este întotdeauna Numărul binar de două cifre de pe cele două linii de ieșire indică care linie de intrare este Desenați diagrama logică a unui demultiplexor pe doi biți în care semnalul de pe o singură linie de intrare este direcționat către una dintre cele patru linii de ieșire, în funcție de valorile celor două linii de control Întrebări și sarcini Redesenați matricea logică programabilă prezentată în fig Arată cum poate fi implementată funcția de majoritate logică pe ea (vezi Figura ) Asigurați-vă că arătați care dintre relațiile potențiale sunt utilizate în prima și a doua matrice I Ce face acest circuit? Un circuit SIS tipic este un sumator de biți Patru astfel de circuite pot fi legate între ele pentru a forma un sumator de biți Câți pini credeți că ar trebui să conțină fiecare sumator de biți? De ce? Un sumator cu n biti se poate obtine prin cascada a n sumatori plini, cu carry to stage r, pe care il vom nota Cr, obtinut din rezultatul calculelor din etapa i - Carry to stage , Co este Dacă calculul sumei și transferului este T ns la fiecare etapă, atunci transferul la etapa i va fi calculat numai după iT ns după începerea însumării Pentru n mare, poate dura foarte mult timp înainte ca transferul la ultima etapă să fie calculat Proiectați un adaos care rulează mai repede Sugestie', fiecare transfer Q poate fi exprimat în termeni de operanzi (biți) D - și - , la fel ca transferul Cr - Folosind această relație, puteți exprima Cr în funcție de semnalele de intrare din stadiu de la la i - , astfel încât toate transferurile să poată fi generate în același timp Dacă toate supapele din fig au o întârziere de tranzit de ns și toate celelalte întârzieri sunt ignorate, cât timp (minimum) este nevoie pentru a obține un semnal de ieșire valid? ALU prezentat în fig este capabil să efectueze adăugarea de numere binare de biți Poate face scăderea binară? Dacă da, vă rugăm să explicați cum Dacă nu, transformați circuitul în așa fel încât să poată scădea O ALU pe biți este asamblată din ALU-uri pe un singur bit, fiecare dintre ele necesită ns pentru a însuma Dacă întârzierea de la o ALU la alta este de ns, cât timp va dura pentru a obține rezultatul final? Uneori este necesar ca o ALU de biți (vezi, de exemplu, Fig ) să scoată o constantă - Sugerați două moduri diferite de a face acest lucru Pentru fiecare metodă, determinați valorile celor șase semnale de control Capitolul Nivel logic digital Care este starea de repaus a intrărilor S și R ale unui latch SR construit din două porți NAND? Schema din fig este un flip-flop care se declanșează pe marginea ascendentă a semnalului de ceas Transformați acest circuit pentru a obține un flip-flop care se declanșează pe marginea de cădere a semnalului de ceas În memoria x prezentată în fig Sunt utilizate porțile , AND și trei porți OR Câte porți din fiecare dintre cele două tipuri vor fi necesare dacă circuitul este extins la o dimensiune de x ? Sfatuiți producătorii de cipuri MIS fără experiență Unul dintre clienții dvs , la cererea unui client potențial important, a propus să producă un cip care să conțină patru D-flip-flops, fiecare dintre ele având ieșiri Q și Q În acest proiect, toate cele semnale de ceas sunt combinate (de asemenea la cererea cumpărătorului) Circuitul nu are intrări presetate și clare Sarcina dumneavoastră este să oferiți o evaluare profesională a acestei dezvoltări Odată cu creșterea cantității de memorie plasată pe un cip, crește și numărul de pini necesari pentru a accesa această memorie A avea un număr mare de pini de adresă pe un cip este destul de incomod Gândiți-vă la o modalitate de a accesa cuvinte de " de memorie când există mai puțini pini decât n Un computer cu o magistrală de date pe de biți utilizează M x RAM dinamică Care este cantitatea minimă de memorie (în octeți) pe care o poate păstra acest computer? Reveniți la diagrama de timp din fig Să presupunem că ați încetinit oscilatorul principal la ns în loc de ns, dar constrângerile de timp au rămas neschimbate Care este cel mai rău caz timp pentru ca memoria să transfere date pe magistrală la momentul T după ce semnalul MREQ este afirmat? Privește din nou la fig Să presupunem că ceasul rulează la MHz și TAD-ul a crescut la ns Mai poți folosi cipuri de memorie de ns? Tabelul arată că valoarea TML ar trebui să fie de cel puțin ns Vă puteți imagina un cip care are acest negativ? Cu alte cuvinte, procesorul poate afirma semnalul MREQ înainte de a afla adresa? Explică de ce Să presupunem că transferul blocului din fig a fost realizat pe autobuz, a cărui diagramă de timp este prezentată în fig Cât de mult mai mult transfer are un transfer de bloc în comparație cu transferurile individuale (pentru blocuri lungi)? Acum să presupunem că lățimea magistralei nu este de , ci de de biți Care va fi răspunsul tău acum? Uită-te la fig Desemnați timpul de transmisie al liniilor de adresă ca TA și TA , timpul de transmisie al liniei MREQ ca TMREq! și TMREq , etc Scrieți toate inegalitățile implicate de strângerea de mână completă Întrebări și sarcini Majoritatea magistralelor pe de biți permit citirea și scrierea în bucăți de biți Există opțiuni pentru unde exact să pun datele? Argument Multe procesoare acceptă un tip special de ciclu de magistrală pentru a confirma o întrerupere De ce este nevoie de asta? Un computer pe de biți cu o magistrală de MHz are nevoie de cicluri pentru a citi un cuvânt de de biți Câtă lățime de bandă a magistralei este consumată de procesor în cel mai rău caz? Un procesor pe de biți cu linii de adresă A -A necesită ca toate referințele de memorie să fie aliniate Aceasta înseamnă că CPU ar trebui să acceseze numai cuvinte formate din , , , etc octeți (numărul de octeți este un multiplu de ) și jumătate de cuvinte formate dintr-un număr par de octeți Octeții pot fi oriunde Câte combinații posibile de operații de citire a memoriei există și câți pini sunt necesari pentru a le implementa? Dă două răspunsuri De ce nu poate funcționa procesorul Pentium cu o magistrală PCI pe de biți fără a degrada funcționalitatea? La urma urmei, alte computere cu o magistrală pe de biți pot transfera , și chiar biți Să presupunem că CPU conține memorie cache de primul și al doilea nivel cu un timp de acces de ns și, respectiv, ns Timpul de acces la memoria principală este de ns Dacă % din toate accesările la memorie sunt în memoria cache L și % sunt în memoria cache L , care este timpul mediu de acces? Poate un sistem încorporat să conţină un cip A? Calculați lățimea de bandă a magistralei necesară pentru afișarea unui film color ( fps) pe un monitor VGA ( x ) Se presupune că datele trebuie să treacă prin magistrală de două ori: o dată - de la CD în memorie, a doua - de la memorie la monitor Care semnal Pentium crezi că setează semnalul FRAME# pe magistrala PCI? Care dintre semnalele prezentate în fig nu sunt obligatorii pentru protocolul autobuzului? Debitul total al tuturor canalelor din PCI Express este de MB/s Câte fire de semnal în fiecare direcție ar fi necesare pentru a rula la viteza de x? Care va fi debitul total în fiecare direcție? Lățime de bandă utilă în fiecare direcție? Calculatorul are nevoie de două cicluri de magistrală pentru a executa fiecare comandă: unul pentru a apela comanda, al doilea pentru a apela datele Fiecare ciclu de magistrală durează ns, iar fiecare instrucțiune durează ns pentru a se executa (timpul de procesare nu este luat în considerare) Computerul are un disc Fiecare pistă a acestui disc constă din de sectoare de octeți Timpul de rotație a discului este de ms Cu ce procent se reduce viteza Capitolul Nivel logic digital computer în cazul accesului direct la memorie, dacă fiecare operare pe de biți a unui astfel de acces durează un ciclu de magistrală? Sarcina maximă a unui pachet de date USB este de de octeți Presupunând că un dispozitiv poate trimite doar un pachet de date pe cadru, care este debitul maxim pentru un singur dispozitiv izocron? Uită-te la fig b Ce se întâmplă dacă adăugăm o a treia linie de intrare conectată la A la poarta NAND, care vă permite să selectați cipul RYU? Scrieți un program care simulează funcționarea unei matrice m x n formată din porți NAND cu două intrări Acest circuit (este plasat pe un cip) conține j pini de intrare și k de ieșire Valorile / k, tip sunt procesate în timpul compilării Programul citește tabelul conexiunilor de câmp, fiecare conexiune definește o intrare și o ieșire Intrarea poate fi fie unul dintre pinii de intrare j, fie ieșirea unei porți NAND Ieșirea poate fi fie una dintre cele k terminale de ieșire, fie o intrare către o poartă NAND Intrările neutilizate iau valoarea uneia logice După citirea tabelului de conexiuni, programul trebuie să imprime o valoare de ieșire pentru fiecare dintre cele > valori de intrare posibile Astfel de rețele de porți sunt utilizate pe scară largă atunci când desenează circuite conform specificațiilor clientului, deoarece cea mai mare parte a acestei lucrări (adică aplicarea unei matrice de porți la un microcircuit) nu depinde de ce fel de circuit va fi Pentru fiecare dezvoltare contează doar alegerea conexiunilor de teren Scrieți un program care ia ca intrare două expresii logice arbitrare și verifică dacă reprezintă aceeași funcție Limbajul de introducere trebuie să includă litere simple (variabile booleene), operanzi AND, OR și NOT și paranteze Fiecare expresie trebuie să se încadreze pe o linie de intrare Programul calculează tabele de adevăr pentru ambele funcții și le compară Scrieți un program care ia o serie de expresii logice ca intrare și construiește matricele de x și x care sunt necesare pentru a implementa aceste expresii în matricea logică programabilă prezentată în fig Limba de intrare este aceeași ca în sarcina anterioară Imprimați aceste matrice pe o imprimantă de linie capitolul nivelul microarhitecturii Deasupra nivelului logic digital este nivelul microarhitecturii Sarcina sa este de a interpreta comenzile de Nivel (arhitectura comenzilor), așa cum se arată în Figura Structura nivelului de microarhitectură depinde de nivelul arhitecturii de instrucțiuni, precum și de costul și scopul computerului În prezent, la nivelul arhitecturii de instrucțiuni, există de obicei instrucțiuni simple care sunt executate într-un singur ciclu (cum ar fi, în special, mașinile RISC) Alte sisteme (cum ar fi Pentium ) au comenzi mai complexe la acest nivel; executarea unei astfel de comenzi durează mai multe cicluri Pentru a executa o instrucțiune, trebuie să găsiți operanzii în memorie, să-i citiți și să scrieți rezultatele înapoi în memorie Managementul nivelului de comandă cu comenzi complexe diferă de managementul nivelului de comandă cu comenzi simple, deoarece în primul caz, executarea unei comenzi necesită o anumită secvență de operații Exemplu de microarhitectură În mod ideal, ar fi bine să descriem mai întâi principiile generale ale dezvoltării la nivel de microarhitectură, dar, din păcate, astfel de principii generale nu există Fiecare dezvoltare este individuală Din acest motiv, ne vom uita doar la un exemplu specific în detaliu Ca exemplu, am ales un subset al mașinii virtuale Java Acest subset conține doar instrucțiuni întregi, așa că l-am numit IJVM (Integer Java Virtual Machine - Java Virtual Machine for Integers) Vom acoperi întreaga mașină virtuală (JVM) în Capitolul Vom începe prin a descrie microarhitectura pe care vom implementa IJVM IJVM conține câteva comenzi destul de complexe După cum sa menționat în Capitolul , aceste arhitecturi sunt adesea implementate prin microprogramare Deși structura IJVM nu este excesiv de complexă, poate fi un bun punct de plecare pentru a descrie principiile de bază ale procesării comenzilor și ordinea în care sunt executate Microarhitectura noastră conține firmware (în ROM) care trebuie să apeleze, să decodeze și să execute comenzi IJVM Nu putem folosi interpretul JVM de la Sun pentru acest firmware, deoarece avem nevoie doar de un firmware mic care rulează porți hardware individuale Interpretul JVM de la Sun este scris în C pentru a asigura portabilitatea software-ului Acest interpret nu poate gestiona hardware-ul la nivelul granular de care avem nevoie Deoarece hardware-ul real constă numai din componente, Capitolul Stratul de microarhitectură descris în Capitolul , teoretic, după ce a citit acest capitol, cititorul ar trebui să poată merge la un magazin, să cumpere o grămadă de tranzistori și să construiască o mașină IJVM Celor care îndeplinesc cu succes această sarcină li se va acorda credit suplimentar (precum și o evaluare psihiatrică completă) Să fim de acord să considerăm fiecare comandă a nivelului arhitecturii comenzii ca o funcție numită din programul principal În acest caz, programul principal este destul de simplu Este un ciclu nesfârșit Mai întâi, programul determină ce funcție să execute, apoi apelează această funcție, după care totul se repetă din nou Firmware-ul conține un set de variabile la care au acces toate funcțiile Acest set de variabile se numește starea computerului Fiecare funcție modifică cel puțin câteva variabile în timp ce generează o stare nouă De exemplu, contorul de programe este parte a statului Specifică locația următoarei funcții (adică instrucțiunea la nivel de arhitectură a instrucțiunii) care urmează să fie executată În timpul execuției fiecărei instrucțiuni, contorul de instrucțiuni indică următoarea instrucțiune Comenzile IJVM sunt foarte scurte Fiecare comandă constă din mai multe câmpuri, de obicei unul sau două, fiecare dintre ele rezolvă o problemă specifică Primul câmp conține codul de operare Acest cod specifică tipul de comandă (de exemplu, adăugare, ramură sau altă comandă) Multe instrucțiuni conțin un câmp suplimentar care specifică tipul operandului De exemplu, comenzile care accesează variabile locale ar trebui să aibă un câmp special pentru a identifica ce variabilă este Acest model de execuție a instrucțiunilor, denumit uneori bucla fetch-execute, este util pentru teorie și poate forma baza pentru implementarea unui strat de arhitectură de instrucțiuni cu instrucțiuni complexe (de exemplu, IJVM) În continuare, descriem cum funcționează acest model, ce este microarhitectura și cum este controlată de microinstrucțiuni, fiecare dintre acestea ocupând o cale de date pentru un ciclu Lista completă de comenzi formează firmware-ul, care va fi discutat în detaliu Calea datelor Calea datelor este o parte a unității centrale de procesare, constând din ALU (unitatea logică aritmetică), intrările și ieșirile sale Calea de date a microarhitecturii noastre este prezentată în Fig Deși această cale de date a fost optimizată pentru interpretarea programelor IJVM, este similară cu căile de date ale majorității computerelor Calea conține un număr de registre pe de biți, cărora le-am atribuit nume simbolice (de exemplu, PC, SP, MDR) Deși unele dintre aceste nume ne sunt familiare, este important să înțelegem că aceste registre sunt disponibile doar la nivel de microarhitectură (pentru firmware) Li se dau aceste nume pentru că de obicei conțin valori corespunzătoare variabilelor numite similar la nivelul arhitecturii instrucțiunilor Conținutul majorității registrelor este trimis către magistrala B Ieșirea ALU controlează circuitul de deplasare și apoi magistrala C Valoarea din magistrala C poate fi scrisă în unul sau mai multe registre în același timp Vom introduce autobuzul A mai târziu, dar deocamdată ne vom imagina că nu există Exemplu de microarhitectură Orez Calea datelor pentru microarhitectura tratată în acest capitol Acest ALU este identic cu cel prezentat în Fig și Funcționarea sa depinde de liniile de control Pe fig o săgeată încrucișată cu numărul în partea de sus indică prezența a șase linii de control ALU Dintre acestea, Fo și Fj sunt folosite pentru a seta operația, ENA și ENB pentru a permite semnalelor de intrare A și B, respectiv, INVA pentru a inversa intrarea din stânga și INC pentru a transfera bitul la bitul cel mai puțin semnificativ, ceea ce este echivalent cu adăugarea Capitolul Stratul de microarhitectură unități la rezultat Cu toate acestea, nu toate cele de combinații de valori de pe liniile de control pot fi utile Unele combinații sunt prezentate în tabel Nu toate aceste caracteristici sunt necesare pentru o mașină IJVM, dar multe dintre ele pot fi utile pentru o mașină cu funcții complete (JVM) În cele mai multe cazuri, există mai multe posibilități de a obține același rezultat În acest tabel, semnul plus (+) înseamnă plus aritmetic, iar semnul minus (-) înseamnă minus aritmetic, deci -A înseamnă complementul lui A Tabelul Unele combinații de semnale ALU și funcțiile lor corespunzătoare Număr de ordine Fo F, ENA ENB INVA INC Funcție A V V A+ B A+ B + A+ B + B - A V - -A AIV A SAU B - ALU prezentat în fig conține două intrări de date: intrarea din stânga (A) și intrarea din dreapta (B) Intrarea din stânga este conectată la registrul de reținere H Intrarea din dreapta este conectată la magistrala B, care poate primi valori de la una dintre cele nouă surse, așa cum este indicat de cele nouă săgeți gri adiacente magistralei Există o altă dezvoltare a ALU cu două autobuze full-size, o vom privi puțin mai târziu în acest capitol Registrul H poate primi o funcție ALU care trece prin intrarea dreaptă (de la magistrala B) către ieșirea ALU O astfel de funcție este adăugarea intrărilor ALU, numai atunci când semnalul ENA este negativ și intrarea din stânga este setată la Adăugarea lui la valoarea magistralei B nu modifică valoarea Rezultatul este apoi trecut prin circuitul de schimbare (de asemenea, neschimbat) și stocat în registrul H Exemplu de microarhitectură Mai sunt două linii de control care sunt utilizate independent de celelalte Acestea servesc la controlul ieșirii ALU Linia SLL (Shift Left Logical - deplasare logică la stânga) mută numărul la stânga cu octet, umplând cei biți cei mai puțin semnificativi cu zerouri Linia SRA (Shift Right Arith-metic - deplasare aritmetică la dreapta) mută numărul la dreapta cu bit, lăsând neschimbată cea mai semnificativă cifră binară Este posibil să citiți și să scrieți același registru într-un singur ciclu Pentru a face acest lucru, de exemplu, trebuie să puneți valoarea SP pe magistrala B, să închideți intrarea din stânga a ALU, să setați semnalul INC și să stocați rezultatul în registrul SP, crescând astfel valoarea cu (vezi linia ) în tabelul ) Dacă același registru poate fi citit și scris într-un singur ciclu, atunci cum puteți preveni apariția datelor inutile? Faptul este că procesele de citire și scriere au loc în diferite părți ale ciclului Când unul dintre registre este selectat ca intrare dreaptă a ALU, valoarea sa este plasată pe magistrala B la începutul ciclului și stocată acolo pe tot parcursul ciclului Apoi, ALU își îndeplinește activitatea, rezultatul căruia este transmis prin circuitul de schimbare la magistrala C Cu puțin timp înainte de sfârșitul ciclului, când valorile de ieșire ale ALU și ale circuitului de schimbare se stabilizează, conținutul C magistrala sunt transferate la unul sau mai multe registre Unul dintre aceste registre poate fi foarte bine cel de la care a fost semnalată magistrala B Timpul precis al căii de date face posibilă citirea și scrierea aceluiași registru într-un singur ciclu Acest lucru va fi discutat în continuare Sincronizarea căilor de date Modul în care sunt sincronizate aceste acțiuni este prezentat în Fig Aici, la începutul fiecărui ciclu, este generat un impuls scurt Poate fi emis de un oscilator principal, așa cum se arată în Fig , c La scăderea pulsului, sunt setați biții care vor declanșa toate porțile Acest proces durează o anumită perioadă de timp în Iad Apoi se selectează un registru și valoarea acestuia este transferată pe magistrala B Acest lucru durează Ar Mai mult, ALU și circuitul de schimbare încep să funcționeze cu datele primite de ei După intervalul Δt/, semnalele de ieșire ale ALU și ale circuitelor de schimbare se stabilizează În timpul următorului segment, Ar, rezultatele trec de-a lungul magistralei C către registre, unde sunt încărcate pe marginea următorului impuls Sarcina trebuie să fie declanșată de margine și instantanee, astfel încât, chiar dacă oricare dintre registrele de intrare este schimbat, magistrala C nu se va schimba până când registrele sunt complet încărcate La marginea pulsului, registrul care declanșează magistrala B se oprește și așteaptă următorul ciclu În figură, există și registre MPC și MIR, precum și memorie Vom discuta despre scopul lor puțin mai târziu Este important să înțelegeți că, deși nu există elemente de stocare în calea datelor, este nevoie de o anumită perioadă de timp pentru ca un semnal să traverseze aceasta Modificarea valorii pe magistrala B provoacă modificări pe magistrala C nu imediat, ci numai după o pauză (acest lucru se datorează întârzierilor la fiecare pas) Prin urmare, chiar dacă unul dintre registrele de intrare se modifică, noua valoare este stocată în registru cu mult înainte ca valoarea veche (și deja incorectă) a acelui registru plasată pe magistrala B să poată ajunge la ALU Capitolul Stratul de microarhitectură Registrele sunt încărcate din magistrala C și din memorie pe marginea semnalului de ceas Ciclul Semnal de ieșire Aw Du i Az Iată noua valoare a MRS folosit pentru a încărca o nouă microinstrucțiune în registrul MIR eu Setarea semnalelor pentru a începe calea datelor ALU și circuit de schimbare Registrul MPS este disponibil aici Registrul H Promotor și semnalul magistralei B de la circuitul de schimbare la registre Orez Timpul ciclului căii datelor Un astfel de sistem necesită o sincronizare strânsă și un ciclu destul de lung; trebuie cunoscut timpul minim de tranzit al semnalului prin ALU; registrele trebuie încărcate din magistrala C foarte repede Dacă abordați această problemă cu suficientă atenție, vă puteți asigura că calea datelor funcționează corect Ciclul căii de date poate fi împărțit în subcicluri Începutul sub-cadrului inițiază un semnal de ceas în scădere Următoarele arată ce se întâmplă în timpul fiecărui sub-ciclu Mărimea subciclului este dată în paranteze Semnalele de control (Aw) sunt setate Valorile registrului sunt încărcate pe magistrala B (Ax) ALU și circuitele de schimbare (Ar/) funcționează Rezultatele sunt transmise pe magistrala C înapoi la registre (Az) La marginea următorului ciclu, rezultatele sunt stocate în registre Nu există semnale externe care să indice începutul și sfârșitul subciclului și să spună ALU când să pornească și să trimită rezultatele către magistrala C În realitate, ALU și circuitele de schimbare a treptelor funcționează în mod constant Cu toate acestea, intrările lor sunt invalide în perioada Aw + Ax În mod similar, semnalele lor de ieșire sunt invalide în perioada Aw + Ax + Ar/ Singurele semnale externe care controlează calea datelor sunt semnalul de ceas descendent, care începe ciclul căii de date, și frontul ascendent al semnalului de ceas, care inițiază încărcarea registrelor din magistrala C Limitele sub-cadrelor sunt determinate numai de timpul de tranzit al semnalului, astfel încât proiectanții de căi de date trebuie să calculeze totul cu mare atenție Exemplu de microarhitectură Funcția de memorie Mașina noastră poate interacționa cu memoria în două moduri: printr-un port cu adresa de cuvânt ( de biți) și printr-un port cu adresa de octeți ( biți) Portul adresat cuvântului este controlat de două registre: MAR (Meshoku Address Register - registru de adresă de memorie) și MDR (Meshoku Data Register - registru de memorie de informații), care sunt prezentate în Fig Portul cu adresa de octet este controlat de registrul PC, care scrie octet în cei biți cei mai puțin semnificativi ai registrului MBR (Buffer Register) Acest port poate citi date din memorie, dar nu poate scrie date în memorie Fiecare dintre aceste registre, precum și toate celelalte registre prezentate în Fig sunt declanșate de unul dintre semnalele de control Săgeata albă de sub registru indică un semnal de control care permite trimiterea ieșirii registrului către magistrala B Registrul MAR nu este conectat la magistrala B, deci nu are un semnal de control de activare Nici registrul H nu are acest semnal, deoarece este singura intrare din stânga posibilă a ALU și, prin urmare, este întotdeauna activată Săgeata neagră de sub registru indică un semnal de control care scrie (adică încarcă) registrul din magistrala C Deoarece registrul MBR nu poate fi încărcat din magistrala C, nu are un semnal de control de scriere (dar are două activare) semnale, care vor fi discutate mai târziu) Pentru a iniția procesul de citire din memorie sau de scriere în memorie, trebuie să încărcați registrele de memorie corespunzătoare și apoi să trimiteți un semnal de citire sau scriere în memorie (nu este prezentat în Fig ) Registrul MAR conține adrese de cuvinte, astfel încât valorile , , etc indică cuvinte succesive Registrul PC conține adrese de octeți, astfel încât valorile , , etc indică octeți consecutivi Dacă valoarea este plasată în registrul PC și procesul de citire este pornit, atunci octetul este citit din memorie, care va fi apoi scris în cei biți cei mai puțin semnificativi ai registrului MBR Dacă valoarea este plasată în registrul MAR și procesul de citire este pornit, atunci octeții de la la (adică cuvântul ) sunt citiți din memorie, care vor fi apoi scrisi în registrul MDR De ce a fost nevoie de două registre cu adresare diferită? Faptul este că registrele MAR și PC sunt necesare pentru a accesa două zone de memorie diferite și de ce este nevoie de acest lucru va deveni clar puțin mai târziu Deocamdată, este suficient să spunem că registrele MAR și MDR sunt folosite pentru a citi și scrie cuvinte de date la nivelul arhitecturii instrucțiunilor, iar registrele PC și MBR sunt folosite pentru a citi programul la nivel de arhitectură a instrucțiunilor, care constă dintr-un flux de octeți În toate celelalte registre care conțin adrese, se aplică principiul adresării cuvintelor, ca în MAR În realitate, există doar un singur octet de memorie adresată Cum accesează registrul MAR cuvintele dacă memoria este formată din octeți? Când o valoare de registru MAR este plasată pe magistrala de adrese, cei de biți ai acelei valori nu se potrivesc exact pe cele de linii de adresă (de la la ) În schimb, bitul este conectat la linia de adresă , bitul unu este conectat la linia de adresă și așa mai departe Cei doi biți cei mai semnificativi nu sunt luați în considerare deoarece sunt necesari doar pentru adresele peste și astfel de adrese nu sunt permise în aparatul nostru de GB Când valoarea MAR este , Capitolul Stratul de microarhitectură adresa este plasată în autobuz; când valoarea MAR este , adresa este plasată pe autobuz și așa mai departe Registrul MAR pe de biți (numărătoare în cuvinte) Nu se ține cont magistrală de adrese pe de biți (numărate în octeți) Orez Atribuirea biților în registrul MAR în magistrala de adrese După cum sa menționat deja, datele citite din memorie printr-un port de biți sunt stocate într-un MBR de biți Acest registru poate fi copiat pe magistrala B în două moduri: semnat și nesemnat Când este necesară o valoare fără semn, cuvântul de de biți plasat pe magistrala B conține valoarea MBR în cei biți inferiori și zerouri în restul de de biți Valorile nesemnate sunt necesare pentru a indexa tabelele sau pentru a obține un număr întreg de biți din doi octeți consecutivi (nesemnati) în fluxul de comandă O altă modalitate de a transforma un MBR de biți într-un cuvânt de de biți este de a-l trata ca o valoare cu semn între - și + inclusiv și de a utiliza această valoare pentru a genera un cuvânt de de biți cu aceeași valoare numerică Această conversie se face prin duplicarea bitului de semn (cel mai din stânga) al MBR în pozițiile de sus de biți ale magistralei B Acest proces se numește extindere a semnului sau extindere a semnului Dacă această opțiune este selectată, atunci fie toți cei de biți superiori vor fi setați la , fie toți vor fi setați la , în funcție de faptul că bitul din stânga MBR este sau În ce valoare de de biți (semnată sau nesemnată) se va transforma valoarea de biți a registrului MBR este determinată de care dintre cele două semnale de control (două săgeți albe sub registrul MBR din Fig ) este setat Caseta punctată din figură arată capacitatea MBR de biți de a acționa ca o sursă de cuvinte de de biți pentru magistrala B Microinstrucțiuni Pentru a gestiona calea datelor prezentată în Fig , avem nevoie de de semnale Ele pot fi împărțite în cinci grupe funcționale: + semnale pentru scrierea datelor din magistrala C în registre; + semnale pentru a permite transferul de registre pe magistrala Viv ALU; Exemplu de microarhitectură ♦ semnale pentru controlul ALU și circuitul de schimbare; ♦ semnale care indică faptul că este necesară citirea sau scrierea prin registrele MAR/MDR (nu sunt prezentate în figură); + semnal, care indică faptul că un apel de memorie trebuie efectuat prin registrele PC / MBR (nu este prezentat și în figură) Valorile acestor de semnale de control determină operațiile pentru un ciclu al căii de date Ciclul constă în transferul valorilor registrelor către magistrala B, trecerea acestor semnale prin ALU și circuitul de deplasare, transferarea rezultatelor în magistrala C și scrierea acestora în registrul dorit (registre) În plus, dacă semnalul de date citite este setat, atunci la sfârșitul ciclului, după ce registrul MAR este încărcat, memoria începe să funcționeze Datele din memorie sunt plasate în MBR sau MDR la sfârșitul următorului ciclu, iar aceste date pot fi utilizate în ciclul care urmează Cu alte cuvinte, dacă citirea din memorie prin oricare dintre porturi începe la sfârșitul ciclului k, atunci datele primite nu pot fi utilizate în ciclul k + (doar în ciclul k + și mai târziu) Acest proces este ilustrat în Fig Semnalele de control al memoriei sunt emise numai după încărcarea registrelor MAR și PC, care are loc pe marginea semnalului de ceas cu puțin timp înainte de sfârșitul ciclului Vom presupune că memoria pune rezultatele pe magistrala de memorie pe parcursul unui ciclu , astfel încât registrele MBR și/sau MDR pot fi încărcate pe următorul front împreună cu alte registre Cu alte cuvinte, încărcăm registrul MAR la sfârșitul ciclului căii de date și inițiază memoria imediat după Prin urmare, nu ne putem aștepta ca rezultatele citite să fie în registrul MDR la începutul următorului ciclu, mai ales dacă lățimea impulsului este scurtă Acest timp nu va fi suficient Prin urmare, trebuie plasat un ciclu între începerea citirii din memorie și utilizarea rezultatului obținut Cu toate acestea, în timpul acestui ciclu, nu numai transferul unui cuvânt din memorie, ci și alte operații pot fi efectuate Presupunând că memoria rulează pentru un ciclu este echivalent cu a presupune o rată de accesare a cache-ului (accesări reușite în cache) de % O astfel de presupunere nu poate fi niciodată adevărată, dar nu vom vorbi aici despre bucle de memorie cu lungime variabilă, deoarece acesta nu este subiectul cărții Deoarece registrele MBR și MDR sunt încărcate pe marginea semnalului de ceas împreună cu alte registre, acestea pot fi citite în timpul ciclurilor în care un cuvânt nou este transferat din memorie Ei returnează valorile vechi pentru că nu a trecut suficient timp pentru ca acestea să fie înlocuite cu cele noi Nu există nicio ambiguitate aici: până când noile valori sunt încărcate în registrele MBR și MDR pe marginea ascendentă, valorile anterioare sunt acolo și pot fi utilizate Rețineți că operațiile de citire pot avea loc una după alta, adică în două cicluri consecutive (deoarece procesul de citire în sine durează doar un ciclu) În plus, ambele amintiri pot funcționa în același timp Cu toate acestea, încercarea de a citi și de a scrie același octet în același timp produce rezultate nedefinite Capitolul Stratul de microarhitectură Ieșirea magistralei C poate fi scrisă în mai multe registre simultan, dar nu este de dorit să se trimită mai mult de un registru către magistrala B Cu puțină circuite, putem reduce numărul de biți necesari pentru a selecta una dintre sursele posibile magistrala B Există doar registre de intrare, care pot porni magistrala B (MBR-urile semnate și nesemnate sunt numărate separat) Prin urmare, putem codifica informațiile pentru magistrala B în biți și folosim decodorul pentru a genera semnale de control, dintre care nu sunt necesare (modelatorii comerciali ar putea dori să scape de unul dintre registre pentru a se descurca cu trei biți, dar noi, ca oameni de știință, preferăm să avem un pic în plus, dar totuși obținem o construcție mai înțeleasă) Acum putem controla calea datelor cu + + + + = de semnale, deci avem nevoie de de biți Cu toate acestea, acești de biți controlează calea datelor doar pentru un ciclu Sarcina managementului este de a determina ce trebuie făcut în următorul ciclu Pentru a ține cont de acest lucru în proiectarea controlerului, vom crea un format pentru descrierea operațiunilor care trebuie efectuate folosind de biți de control și două câmpuri suplimentare: câmpul NEXT ADDRESS (următoarea adresă) și câmpul JAM Conținutul fiecăruia dintre aceste câmpuri va fi discutat mai târziu Pe fig arată unul dintre formatele posibile Conține următoarele grupuri care conțin de semnale: ♦ Adresa - adresa urmatoarei microinstructiuni potentiale; ♦ JAM - determină cum este selectată următoarea microinstrucțiune; ♦ ALU - funcții ALU și circuite de schimbare a treptelor; ♦ C - selectarea registrelor care sunt scrise din magistrala C; ♦ Met - funcții de memorie; ♦ B - selectarea sursei pentru magistrala B (cum este codificată, a fost arătat mai devreme) Biți NEXT ADDRESS J M P C J A M NJ A M ZSLL SR A Fo Fi E N A E N B INV A IN C O R S t o S c p p LVS p p c m DR M A RWRI T E R E A DF E T C n Bar B Adr JAM ALU C Met B Registrele autobuzului B O-MDR - RS -MBR -MBRU -SP -LV - CRR -TOS -ORS - - nr Orez Format de microinstrucțiuni pentru Міс- Ordinea grupurilor este, în principiu, arbitrară, deși am ales-o lung și cu grijă pentru a evita intersecțiile din diagrama prezentată în Fig De Exemplu de microarhitectură Astfel de încrucișări pe diagrame corespund adesea încrucișărilor de fire pe circuite integrate Ele fac dezvoltarea mult mai dificilă și cel mai bine sunt menținute la minimum Semnale de gestionare a memoriei (rd, wr, fetch) Orez Diagrama completă a microarhitecturii Mіs- Managementul microinstructiunilor - microarhitectura Mis- Până acum, am vorbit despre controlul căii de date și nu am atins problema ce semnal de control și pe ce ciclu ar trebui setat Pentru a face acest lucru, există un controler de secvență, care este responsabil pentru secvența operațiunilor necesare pentru a executa o comandă Capitolul Stratul de microarhitectură Sequencerul ar trebui să scoată următoarele informații la fiecare ciclu: ♦ starea fiecărui semnal de control din sistem; ♦ adresa microinstrucțiunii care urmează să fie executată Figura este o diagramă detaliată a microarhitecturii complete a mașinii noastre, pe care am numit-o Mis- Deși la prima vedere poate părea impresionant, trebuie studiat în detaliu Dacă înțelegeți toate blocurile și relațiile lor prezentate în această figură, vă va fi mai ușor să înțelegeți structura nivelului de microarhitectură Diagrama constă din două părți: calea datelor (stânga), despre care am discutat deja în detaliu, și blocul de control (dreapta), pe care îl vom lua în considerare acum Cea mai mare și mai importantă parte a unității de control este memoria de control Este convenabil să ne gândim la ea ca la o memorie care stochează tot firmware-ul, deși uneori firmware-ul este implementat ca un set de porți logice Ne vom referi la ea ca memorie de control pentru a nu fi confundată cu memoria principală, care este accesată prin registrele MBR și MDR Din punct de vedere funcțional, memoria de control este o memorie care stochează micro-instrucțiuni în loc de instrucțiuni obișnuite În exemplul nostru, conține cuvinte; fiecare cuvânt este format dintr-o microinstrucțiune de de biți, al cărei format este prezentat în Fig Nu toate aceste cuvinte sunt de fapt necesare, dar din mai multe motive avem nevoie de adrese pentru cuvinte individuale Memoria de control diferă de memoria principală prin aceea că instrucțiunile stocate în memoria principală sunt executate în funcție de adresele lor (cu excepția ramurilor), în timp ce microinstrucțiunile nu sunt Creșterea contorului programului din Listatul înseamnă că instrucțiunea care va fi executată după cea curentă se află după aceasta în memorie Microprogramele ar trebui să fie mai flexibile, deoarece secvențele de microinstrucțiuni sunt de obicei scurte și nu au această proprietate În schimb, fiecare microinstrucțiune în sine indică către următoarea microinstrucțiune Deoarece memoria de control este funcțional ROM, are nevoie de propriul registru de adrese și de date Nu necesită semnale de citire și scriere deoarece procesul de citire este în desfășurare Vom apela registrul de adrese al memoriei de control MPC (MicroProgram Counter - microprogram counter) Numele nu este foarte potrivit, deoarece firmware-ul nu este ordonat în mod explicit, iar conceptul de contor este nepotrivit aici, dar nu putem merge împotriva tradiției Vom numi registrul de date MIR (Місго-Instruction Register - microinstruction register) Conține microinstrucțiunea curentă, ai cărui biți declanșează semnale de control care afectează funcționarea căii de date Registrul MIR prezentat în fig conține aceleași șase grupuri de semnale așa cum se arată în fig Grupurile Addr și J (la fel ca JAM) controlează selecția următoarei microinstrucțiuni Le vom discuta puțin mai târziu Grupul ALU conține biți care vă permit să selectați funcția ALU și să porniți circuitul de schimbare Biții C încarcă registre individuale din magistrala C Semnalele M controlează funcționarea memoriei Exemplu de microarhitectură În cele din urmă, ultimii biți pornesc decodorul, care determină ce valoare a registrului va fi trimisă magistralei B În acest caz, am ales un decodor cu intrări și ieșiri, deși există doar registre diferite Un model mai elaborat ar putea folosi un decodor cu intrări și ieșiri Folosim schema standard pentru a nu dezvolta propria noastră schemă Este mult mai ușor să utilizați schema standard și, în plus, veți putea evita greșelile Propriul cip va ocupa mai puțin spațiu, dar va dura destul de mult timp pentru a se dezvolta și este posibil să nu îl construiți corect Schema prezentată în fig funcționează așa La începutul fiecărui ciclu (fața semnalului de ceas din Fig ), un cuvânt este încărcat în registrul MIR din memoria de control, care în figură este marcat cu literele MPC Încărcarea registrului MIR durează o perioadă, adică primul subciclu (vezi Figura ) Când o microinstrucțiune intră în MIR, diferite semnale intră pe calea datelor Valoarea unui anumit registru este plasată pe magistrala B, iar ALU știe ce operație să efectueze Toate acestea se întâmplă în timpul celui de-al doilea subciclu După o perioadă de + Ax, semnalele de intrare ALU se stabilizează După perioada Ag/, semnalele N și Z ale ALU, precum și semnalul de ieșire al circuitului de schimbare, se stabilizează Valorile N și Z sunt apoi stocate în două bistabile cu un singur bit Acești biți, precum și biții tuturor registrelor care sunt încărcate din magistrala C și din memorie, sunt stocați pe marginea semnalului de ceas, aproape de sfârșitul ciclului căii de date Ieșirea ALU nu este stocată, ci pur și simplu transmisă circuitului de schimbare Funcționarea ALU și a circuitelor de schimbare are loc în timpul subciclului După următorul interval, Az, ieșirea schimbătorului, care trece prin magistrala C, ajunge în registre Registrele sunt încărcate la sfârșitul ciclului pe frontul ascendent al semnalului de ceas (vezi Figura ) În timpul subciclului , sunt încărcate registre și flip-flops N și Z Subciclul se termină imediat după sfârșitul muchiei, când toate valorile sunt salvate, rezultatele operațiunilor anterioare de memorie sunt disponibile, registrul MPC este încărcat Acest proces continuă din nou și din nou până când opriți computerul Nu numai că microprogramul trebuie să gestioneze calea datelor, dar trebuie și să determine ce microinstrucțiune trebuie executată în continuare, deoarece microprogramele nu sunt organizate în memoria de control Calculul adresei următoarei microinstrucțiuni începe după ce registrul MIR este încărcat Mai întâi, câmpul NEXT ADDRESS de biți (următoarea adresă) este copiat în registrul MPC În timp ce copia este în curs, câmpul JAM este verificat Dacă conține valoarea OOO, atunci nu trebuie făcut nimic altceva, iar când copia câmpului NEXT ADDRESS este completă, registrul MPC va indica următoarea microinstrucțiune Dacă unul sau mai mulți biți din câmpul JAM sunt , atunci este necesară o acțiune suplimentară Dacă bitul JAMN este , atunci flip-flop N este OR la bitul înalt al registrului MPC Dacă bitul JAMZ este , atunci flip-flop-ul Z este OR la bitul înalt al registrului MPC Dacă ambii biți sunt , ambii sunt OR la același bit Acum să explicăm de ce sunt necesare flip-flops N și Z Faptul este că după marginea semnalului (și până la cădere), magistrala B nu mai pornește, așa că semnalele de ieșire ale ALU nu mai pot fi considerate corecte Stocarea steagurilor de stare ALU în registre Capitolul Stratul de microarhitectură N și Z fac ca valorile corecte să fie stabile și disponibile pentru calculul MPC, indiferent de ce se întâmplă în jurul ALU Pe fig , blocul care efectuează acest calcul este etichetat "Most Bit" Evaluează următoarea funcție booleană: F = ((JAMZ ȘI Z) SAU (JAMN ȘI N)) SAU NEXT ADDRESS[ ] Rețineți că, în orice caz, registrul MPC poate lua doar una dintre cele două valori posibile: Valoarea NEXTADDRESS Valoarea lui NEXT ADDRESS cu cel mai semnificativ bit OR este transformată în unul logic Nu există alte valori Dacă MSB-ul valorii NEXT ADDRESS este deja , nu are rost să folosiți JAMN sau JAMZ Rețineți că dacă toți biții JAM sunt , atunci adresa următoarei instrucțiuni este pur și simplu numărul de biți din câmpul NEXT ADDRESS Dacă bitul JAMN sau JAMZ este , atunci există două adrese potențiale pentru următoarea microinstrucțiune (simbolurile Ox indică faptul că numărul care le urmează este dat în notație hexazecimală): adresa NEXT ADDRESS și adresa NEXT ADDRESS OR la x (presupunând că NEXT ADDRESS a a a SP-^ a a a a a LV a LV-^ a LV a LV-^ a +a a B C D Orez Utilizarea stivei de operanzi pentru a efectua aritmetica Acum putem efectua calculul executând o comandă care scoate două cuvinte din stivă, le adună și împinge rezultatul înapoi în stivă, așa cum se arată în Figura , c Cuvântul de sus poate fi apoi scos din stivă și plasat în variabila locală al, așa cum se arată în Figura , oraș Capitolul Stratul de microarhitectură Cadrele variabile locale și stivele de operanzi pot fi amestecate De exemplu, când funcția / este apelată la evaluarea expresiei x + /(x), o parte a acestei expresii (x ) poate fi în stiva de operanzi Rezultatul evaluării funcției rămâne pe stiva de deasupra x , astfel încât instrucțiunea următoare poate adăuga operanzii Trebuie menționat că toate mașinile folosesc stiva pentru a stoca variabilele locale, dar nu toate îl folosesc pentru a stoca operanzi Majoritatea mașinilor nu au o stivă de operanzi, dar atât JVM-ul cât și IJVM au Vom acoperi operațiunile stivei în detaliu în Capitolul Model de memorie IJVM Și acum ne putem uita la arhitectura IJVM Este format din memorie, care poate fi vizualizată fie ca o matrice de de octeți ( GB), fie ca o matrice de de cuvinte, fiecare conținând octeți Spre deosebire de majoritatea arhitecturilor de instrucțiuni, Java Virtual Machine nu face accesele de memorie vizibile la nivel de instrucțiuni, ci are câteva adrese implicite care formează baza unui pointer Instrucțiunile IJVM pot accesa memoria numai prin acești pointeri Sunt definite următoarele zone de memorie: ♦ Un set de constante Această regiune, care nu poate fi scrisă dintr-un program IJVM, constă din constante, șiruri și pointeri către alte regiuni de memorie care pot fi referite Această zonă este încărcată când programul este încărcat în memorie și nu se modifică după aceea Există un registru ascuns CPP (Constant Pool Pointer - un pointer către un set de constante), care conține adresa primului cuvânt al setului de constante ♦ Cadrul variabilelor locale Această zonă este concepută pentru a stoca variabile în timpul execuției procedurii După cum sa menționat deja, se numește cadrul variabilelor locale La începutul acestui cadru se află parametrii (sau argumentele) procedurii apelate Cadrul variabil local nu include o stivă de operanzi Se aseaza separat Din motive de performanță, am plasat stiva de operanzi chiar deasupra cadrului variabil local Există un registru ascuns care conține adresa primei variabile cadru Vom numi acest registru LV (variabilă locală) Parametrii procedurii apelate sunt stocați la începutul cadrului variabil local ♦ Stiva de operanzi Stiva de operanzi nu trebuie să fie mai mare decât o anumită dimensiune, care este precalculată de compilatorul Java Spațiul stivei de operanzi este situat direct deasupra cadrului variabil local, așa cum se arată în Figura În acest caz, este convenabil să ne gândim la stiva de operanzi ca parte a cadrului variabil local În ambele cazuri, există un registru virtual care conține adresa cuvântului de sus al stivei Rețineți că, spre deosebire de registrele CPP și LV, acest pointer se modifică în timpul execuției procedurii pe măsură ce operanzii sunt împinși în și în afara stivei Exemplu de arhitectură de set de instrucțiuni - IJVM ♦ Zona de procedură În cele din urmă, există zona de memorie care conține programul Există un registru virtual care conține adresa instrucțiunii care urmează să fie apelată Acest indicator este numit Program Counter (PC) Spre deosebire de alte zone de memorie, zona de procedură este o matrice de octeți SP Set de constante SRR Stiva de operanzi curente Localnici actuali Cadru variabil local Cadru variabil local LV Orez zone de memorie IJVM Zona de procedură RS Ar trebui făcută o remarcă despre indicații Registrele CPP, LV și SP indică cuvinte, nu octeți, iar decalajele apar cu un anumit număr de cuvinte De exemplu, valorile LV, LV + și LV + indică primele trei cuvinte ale unui cadru variabil local, iar LV, LV + și LV + indică cuvintele la patru cuvinte ( octeți) distanță Registrul PC, pe de altă parte, conține adrese de octeți, iar schimbarea acestuia înseamnă creșterea cu un anumit număr de octeți, nu cuvinte Accesul la memoria registrului PC diferă de accesul altor registre, prin urmare, în mașina Mіs- , este prevăzut un port de memorie special pentru PC Amintiți-vă că dimensiunea sa este de doar un octet Dacă măriți PC-ul cu unul și efectuați o citire, acest lucru va determina apelarea următorului octet Dacă creșteți SP cu unul și efectuați o citire, acest lucru va face ca următorul cuvânt să fie apelat Setul de comenzi IJVM Setul de comenzi IJVM este prezentat în tabel Fiecare instrucțiune constă dintr-un cod operațional și uneori un operand (de exemplu, un offset de adresă sau o constantă) Prima coloană conține codul hexazecimal al comenzii A doua coloană oferă mnemonicul în limbaj de asamblare A treia coloană descrie scopul comenzii Capitolul Stratul de microarhitectură Tabelul Un set de comenzi IJVM Dimensiunea operanzilor byte, const și varnum este de octet Dimensiunea operanzilor disp, index și offset - octeți Notă mnemonică Neh x BIPUSH byte Împinge un octet în stivă x DUP Copiază cuvântul de sus al stivei și îl împinge pe stivă xA GOTO offset Salt necondiționat x IADD Scoate două cuvinte din stivă; împinge suma lor pe stivă x E IAND Scoate două cuvinte din stivă; împinge rezultatul unei înmulțiri logice pe stivă (operație AND) x IFEQ offset Scoate un cuvânt din stivă și sare dacă este zero x B IFLT offset Scoate un cuvânt din stivă și sare dacă este mai mic decât zero x F IFJCMPEQ offset Afișează două cuvinte din stivă; salturi dacă sunt egale x IINC varnum const Adaugă o constantă la o variabilă locală x ILOAD varnum Impinge o variabilă locală în stivă OxWb INVOKEVIRTUAL disp Apelează o procedură x IOR Scoate două cuvinte din stivă; împinge rezultatul unei adăugări logice pe stivă (operație SAU) xAC IRETURN Returnează rezultatul procedurii (întreg) x ISTORE varnum Scoate un cuvânt din stivă și îl stochează în cadrul variabil local x ISUB Scoate două cuvinte din stivă; împinge diferența lor pe stivă x LDC W index Preia o constantă din setul de constante și o împinge în stivă x NOP Nicio acțiune x POP Îndepărtează cuvântul de sus al stivei x F SWAP Schimbă primele două cuvinte ale stivei Comanda xC WIDE Prefix; următoarea comandă conține un index de biți Sunt necesare comenzi pentru a împinge cuvinte din diferite surse în stivă Sursele sunt setul constant (LDC W), cadrul variabil local (ILOAD) și comanda în sine (BIPUSH) O variabilă poate fi, de asemenea, scoasă din stivă și stocată în cadrul variabilelor locale (ISTORE) Două operații aritmetice (IADD și ISUB) și două operații logice (IAND și I R) pot fi efectuate pe primele două cuvinte ale stivei Când se efectuează orice operație aritmetică sau logică, două cuvinte sunt scoase din stivă și rezultatul este împins înapoi pe stivă Există instrucțiuni de sărituri: una pentru un salt necondiționat (GOTO) și alte trei pentru sărituri condiționate (IFEQ, IFLT și IF ICMPEQ) Toate acestea co Exemplu de arhitectură de set de instrucțiuni - IJVM Mands schimbă valoarea PC-ului la dimensiunea offset-ului lor, care urmează opcode-ul din comandă Operandul offset este format din biți Este adăugat la adresa opcode-ului Există, de asemenea, comenzi pentru schimbarea celor două cuvinte de sus ale stivei (SWAP), duplicarea cuvântului de sus (DUP) și ștergerea cuvântului de sus (POP) Unele comenzi au un format complex care permite prescurtarea versiunilor utilizate în mod obișnuit Dintre toate mecanismele pe care le folosește JVM pentru a face acest lucru, am inclus două în IJVM Într-un caz, am omis forma scurtă în favoarea celei mai tradiționale Într-un alt caz, arătăm cum poate fi folosită comanda prefix WIDE pentru a schimba următoarea comandă În sfârșit, există comanda de a apela o altă procedură (INVOKEVIRTUAL) și comanda de a ieși din procedura curentă și de a reveni la procedura din care a fost apelată (IRETURN) Datorită complexității mecanismului, am simplificat puțin definiția Limitarea este că, spre deosebire de limbajul Java, în exemplul nostru, o procedură poate apela doar o procedură care se află în interiorul ei Deși această restricție este contrară limbajului Java, ea permite un mecanism mai simplu fără a fi nevoie să aloce dinamic procedura (Dacă nu sunteți familiarizat cu programarea orientată pe obiecte, puteți ignora această sugestie Tocmai am transformat Java dintr-un limbaj orientat pe obiecte într-un limbaj simplu precum C sau Pascal ) Pe toate mașinile, cu excepția JVM-ului, adresa procedura care urmează să fie apelată este direct definită de comanda CALL, deci abordarea noastră este mai degrabă regula decât excepția Mecanismul de apelare a procedurii este următorul Mai întâi, programul apelant împinge un pointer către obiectul apelat pe stivă Pe fig , iar acest indicator este notat prin simbolurile OBJREF Programul care apelează apoi împinge parametrii procedurii (în acest exemplu, Parametrul Y, Parametrul și Parametrul ) în stivă După aceea, comanda INVOKEVIRTUAL este executată Comanda INVOKEVIRTUAL include o adresă relativă (disp) care indică o poziție într-un set de constante Această poziție conține adresa de pornire a procedurii apelate, care este stocată în zona procedurilor Primii octeți din zona de procedură conțin date speciale Primii octeți sunt un număr întreg de biți care indică numărul de parametri pentru această procedură (parametrii înșiși au fost introduși anterior în stivă) În acest caz, pointerul OBJREF este tratat ca un parametru, parametrul Acest număr întreg de biți, împreună cu valoarea SP, oferă adresa OBJREF Rețineți că registrul LV indică OBJREF, nu primul parametru real Alegerea a ceea ce indică LV este oarecum arbitrară Următorii octeți din zona procedurii sunt un alt număr întreg de biți care specifică dimensiunea zonei variabile locale pentru procedura apelată Faptul este că pentru această procedură este furnizat un nou stivă, care este situat direct deasupra cadrului de variabile locale, iar acest număr este necesar pentru aceasta În cele din urmă, al cincilea octet din zona de procedură conține codul pentru prima operație care trebuie efectuată Capitolul Stratul de microarhitectură Stack până când INVOKEVIRTUAL este executat împins afară din stiva opțiuni Procedura de apelare a cadrului variabil local Parametrul f Valoarea anterioară LV Valoare PC anterioară Variabile locale ale procedurii de apelare Parametru Parametru Indicator de legătură SP LV Stack după executarea comenzii INVOKEVIRTUAL Baza stivei după executarea comenzii INVOKEVIRTUAL Baza stivei înainte de executarea instrucțiunii INVOKEVIRTUAL I \h:% hystr? Apelant LV , * proceduri ' , , înregistrați apelantul -rs "procedura i\ Spaţiu •pentru variabilele locale ' /( procedura de apelare ' ; Parametrul Parametrul / Parametrul Valoarea anterioară LV Valoarea anterioară RS Procedura de apelare Variabile locale Frame Parametrul Parametrul Indicator de legătură b Orez Memorie înainte de executarea comenzii INVOKEVIRTUAL (a); memorie după executarea acestei comenzi (b) Să vedem ce se întâmplă înainte ca procedura să fie apelată (vezi și Figura ) Cei doi octeți nesemnați care urmează codului operațional sunt utilizați pentru a indexa tabelul constant (primul octet este ridicat) Comanda calculează adresa de bază a unui nou cadru de variabile locale Pentru a face acest lucru, numărul de parametri este scăzut din indicatorul stivei și LV este setat la OBJREF OBJREF stochează adresa celulei care conține valoarea veche a PC-ului Această adresă se calculează după cum urmează Adresa conținută în registrul LV se adaugă la dimensiunea cadrului variabilelor locale (parametri + variabile locale) Chiar deasupra adresei la care urmează să fie stocată vechea valoare PC se află adresa la care urmează să fie stocată vechea valoare LV Stiva pentru procedura nou apelată începe deasupra acestei adrese SP indică vechea valoare LV, a cărei adresă se află imediat sub prima locație de stivă goală Amintiți-vă că SP indică întotdeauna cuvântul de sus al stivei Dacă stiva este goală, atunci SP indică adresa imediat sub stivă, deoarece stiva este umplută de jos în sus Exemplu de arhitectură de set de instrucțiuni - IJVM În cele din urmă, pentru a executa instrucțiunea INVOKEVIRTUAL, trebuie să faceți ca registrul PC să arate către al cincilea octet din spațiul de cod al procedurii Comanda IRETURN este opusul comenzii INVOKEVIRTUAL (Figura ) Eliberează spațiul folosit de procedură De asemenea, readuce stiva la starea anterioară, cu excepția faptului că, mai întâi, OBJREF și toți parametrii sunt eliminați din stivă; în al doilea rând, valoarea returnată este împinsă în stivă, unde era parametrul OBJREF Pentru a restabili starea anterioară, comanda IRETURN trebuie să returneze valorile anterioare ale pointerilor PC și LV Pentru a face acest lucru, se referă la indicatorul de legătură (acesta este un cuvânt determinat de valoarea curentă a LV) În această locație, unde se afla inițial parametrul OBJREF, comanda INVOKEVIRTUAL a stocat o adresă care conținea vechea valoare PC Acest cuvânt, precum și cuvântul de deasupra lui, sunt extrase pentru a restabili vechile valori PC și, respectiv, LV Valoarea returnată, care este stocată în partea de sus a stivei procedurii de ieșire, este copiată în locația originală a parametrului OBJREF, după care SP începe să indice acea adresă Și apoi controlul trece la comanda care urmează imediat INVOKEVIRTUAL Stivuiți până când se execută IRETURN Cadru de variabile locale "Procedura de apelare" Valoare returnată Valoarea anterioară LV Valoarea anterioară RS Variabilele locale ale procedurii de apelare Parametrul Parametrul Parametrul Indicator de legătură Valoarea anterioară LV Valoarea anterioară RS Variabilele locale ale procedurii de apelare Parametrul Parametrul - Indicator de legătură SP LV Baza stivei după executarea instrucțiunii IRETURN A Baza stivei înainte de executarea instrucțiunii IRETURN Stack după IRETURN Returnabil Valoarea anterioară LV Valoare PC anterioară Variabile locale ale procedurii de apelare Parametru Parametru - Pointer de legătură SP LV b Orez Memorie înainte de executarea comenzii IRETURN (a); memorie după executarea acestei comenzi (b) Capitolul Stratul de microarhitectură Până acum, mașina noastră nu a avut nicio comandă I/O Nu le vom prezenta În exemplul nostru, ca și în Java Virtual Machine, acestea nu sunt necesare, iar descrierea JVM nu menționează niciodată procesele I/O Se crede că o mașină fără mecanisme I/O este mai fiabilă (Citirea și scrierea se fac în JVM apelând proceduri speciale ) Compilarea IJVM Acum să vedem ce legătură are limbajul Java cu IJVM Lista arată un mic fragment din programul Java Compilatorul Java ar trebui să rescrie acest program în programul de limbaj de asamblare IJVM prezentat în Listarea Numerele de la la din partea stângă a listei, precum și comentariile după barele oblice duble (//), nu fac parte din programul în sine Ele sunt date pentru claritate și pur și simplu fac mai ușor de înțeles Asamblatorul Java îl va traduce apoi într-un program binar Acest program este prezentat în Lista (De fapt, ieșirea compilatorului Java este imediat binară ) În acest exemplu, i este variabila locală , j este variabila locală și k este variabila locală Lista Fragment de program Java i=j+k; dacă(I== ) k= ; el se j=jl: Lista Program pentru IJVM în limbaj de asamblare Java ILOAD j // =j+k ÎNCĂRCARE k IADD ISTORE ILOAD // f( == ) BIPUSH IFJCMPEQLI ILOAD j UJ=j- BIPUSH ISUB Și ISTORE j GOTO L LI: BIPUSH // k= ISTORE k L : Lista Program pentru IJVM în cod hex x x x x x x x x x x x x F x x D x x x x Exemplu de implementare a microarhitecturii x x x xA x x x x x x Programul compilat este simplu Mai întâi, j și k sunt împinși pe stivă, adunați împreună, iar rezultatul este stocat în i Apoi i și constanta sunt împinse pe stivă și comparate Dacă sunt egale, atunci se face o ramură condiționată la L , unde k primește valoarea Dacă nu sunt egale, atunci se execută partea de program după instrucțiunea IF ICMPEQ După aceea, se efectuează tranziția la L , unde părțile ele și apoi sunt combinate Stiva de operanzi pentru programul din Lista este prezentată în Figura - Înainte de a începe programul, stiva este goală, ceea ce este arătat de linia orizontală de deasupra numărului După executarea primei instrucțiuni ILOAD j, acesta este plasat pe stivă (dreptunghiul de deasupra numărului din figură) Numărul înseamnă că prima comandă a fost executată După executarea celei de-a doua instrucțiuni ILOAD, există deja două cuvinte pe stivă, așa cum se arată în caseta de deasupra numărului După executarea instrucțiunii IADD, rămâne doar un cuvânt pe stivă, care este suma j + k Când cuvântul de sus este scos din stivă și stocat în i, stiva devine din nou goală La GNK-| g~~g~ DESPRE □EOZ Orez Starea stivei după executarea fiecărei instrucțiuni din programul prezentat în Listarea Comanda (ILOAD) pornește instrucțiunea if Această comandă împinge i în stivă Apoi vine constanta (în comanda ) După comparație, stiva devine din nou goală ( ) Comanda este începutul fragmentului else Continuă până la instrucțiunea , când se face saltul la eticheta L Exemplu de implementare a microarhitecturii Am descris în detaliu micro- și macro-arhitectura Rămâne de implementat Cu alte cuvinte, trebuie să aflăm ce este un program la nivel de microarhitectură care interpretează microinstrucțiunile și cum funcționează Înainte de a face acest lucru, să ne familiarizăm cu notația pe care o vom folosi pentru descriere Capitolul Stratul de microarhitectură Microinstrucțiuni și înregistrarea acestora În principiu, am putea descrie funcționarea memoriei de control folosind sistemul de numere binar, de biți pe cuvânt Dar este mult mai convenabil să introduceți un sistem de notație cu care puteți transmite esența problemelor luate în considerare și, în același timp, să nu intrați în detalii inutile Este important să înțelegem că limbajul ales este destinat să ilustreze principiile de bază ale modului în care funcționează programul și nu este deloc destinat utilizării în proiecte noi Dacă scopul nostru ar fi aplicarea practică a limbajului, am introduce o notație complet diferită pentru a maximiza flexibilitatea programului În acest caz, problema alegerii adreselor ar fi foarte importantă, deoarece adresele din memorie sunt neordonate Cât de eficient vor fi alese adresele este determinat de capacitatea dezvoltatorului Prin urmare, vom introduce un limbaj simbolic simplu care descrie complet fiecare operație, dar fără a defini complet toate adresele necesare Notația noastră arată toate acțiunile care au loc pe o linie într-un ciclu Teoretic, am putea folosi un limbaj de nivel înalt pentru a descrie aceste operațiuni, dar un astfel de limbaj nu permite dezvoltatorului să aibă control deplin asupra buclelor Datorită acestui control, puteți analiza fiecare ciclu, puteți înțelege toate operațiunile și le puteți verifica Dacă scopul dezvoltării este de a îmbunătăți viteza și performanța, fiecare ciclu contează În implementarea practică, multe tehnici diferite pot fi utilizate pentru a salva ciclurile Există un mare beneficiu pentru această economie: dacă o instrucțiune cu patru cicluri este redusă cu cicluri, va rula de două ori mai repede, iar această creștere a vitezei va fi atinsă de fiecare dată când această instrucțiune este apelată O abordare posibilă este să oferiți pur și simplu o listă de semnale care ar trebui să se declanșeze în fiecare ciclu Să presupunem că într-un ciclu dorim să creștem valoarea SP cu unul De asemenea, dorim să inițiem o operație de citire și astfel încât următoarea comandă să fie în celula a memoriei de control Atunci am putea scrie ReadRegister=SP, ALU=INC WSP Citiți, NEXT ADDRESS= Aici WSP înseamnă "registru de scriere SP" Această intrare este completă, dar greu de înțeles În schimb, vom combina operațiunile specificate și vom transmite rezultatul acțiunilor în înregistrare: SP = SP + ; rd Să numim microasamblatorul nostru de nivel înalt MAL (Micro Assembly Language - microassembler) În franceză, "mal" înseamnă "boală" - asta se va întâmpla cu tine dacă scrii programe prea mari în această limbă Limbajul MAL a fost inventat doar pentru a demonstra principalele caracteristici ale microarhitecturii În timpul fiecărui ciclu, orice registre poate fi scris, dar de obicei este scris doar unul Valoarea unui singur registru poate fi transferată pe magistrala Viv ALU Pe magistrala A, poate fi + , , - și înregistrarea H Prin urmare, pentru a desemna un anumit Exemplu de implementare a microarhitecturii Pentru o operație leneșă, putem folosi un operator de atribuire simplu, ca în limbajul Java De exemplu, pentru a copia registrul SP în registrul MDR, putem scrie MDR=SP Pentru a arăta că folosim o funcție ALU, putem scrie, de exemplu, astfel: MDR = H + SP Această linie înseamnă că valoarea registrului H este adăugată la valoarea registrului SP și rezultatul este scris în registrul MDR Operația de adunare este comutativă (însemnând că ordinea operanzilor nu contează), deci expresia de mai sus poate fi scrisă ca MDR = SP + N Aceasta generează aceeași microinstrucțiune de de biți, deși, strict vorbind, H este operandul din stânga al ALU Trebuie să folosim numai operațiuni valide; sunt enumerate mai jos (oricare dintre operațiunile enumerate poate fi extinsă prin adăugarea caracterelor " ", ceea ce înseamnă mutarea rezultatului la stânga cu octet, de exemplu, este adesea folosită operația H = MBR " "): DEST=H DEST = SURSA DEST=R DEST=SUURCE DEST = H + SURSA DEST = H + SURSA + DEST = H + DEST = SOURCE + DEST = SOURCE - H DEST = SOURCE - DEST = -H DEST = H ȘI SURSA DEST=H SAU SURSA DEST = DEST = DEST = - Aici SOURCE este valoarea oricăruia dintre registre: MDR, PC, MBR, MBRU, SP, LV, CPP, TOS și OPC; un MBRU înseamnă MBR nesemnat, adică valoarea registrului MBR este nesemnat Toate aceste registre pot acționa ca surse de valoare pentru ALU (ele intră în ALU prin magistrala B) În mod similar, DEST se poate referi la oricare dintre următoarele registre: MAR, MDR, PC, SP, LV, CPP, TOS, OPC și H; fiecare dintre aceste registre poate fi ținta unei ieșiri ALU care este trimisă la registrele de pe magistrala C Multe declarații aparent rezonabile sunt invalide De exemplu, următoarea expresie pare destul de corectă, dar această operație nu poate fi efectuată în calea datelor prezentată în Fig , pentru un ciclu: MDR = SP + MDR Capitolul Stratul de microarhitectură Această restricție există deoarece pentru operația de adunare (spre deosebire de creșterea sau descreșterea cu ) unul dintre operanzi trebuie să fie valoarea registrului H În mod similar, de exemplu, această expresie ar putea fi utilă: H = H - MDR Cu toate acestea, este invalid, deoarece singura sursă posibilă a subtraendului este registrul H Nu ar trebui să existe expresii în asamblare care să pară a fi valide, dar de fapt nevalide Notația noastră permite mai mulți operatori de atribuire De exemplu, pentru a adăuga la registrul SP și pentru a stoca valoarea rezultată în registrele SP și MDR, veți scrie următoarele: SP=MDR=SP+ Pentru a desemna procesele de citire din memorie și scriere în cuvinte de memorie de octeți, vom introduce operatorii rd și wr în microinstrucțiune Pentru a apela un octet printr-un port de un octet, utilizați instrucțiunea fetch Operațiile de atribuire și operațiile de manipulare a memoriei pot avea loc în același ciclu Ceea ce se întâmplă într-un ciclu este scris pe o singură linie Pentru a evita confuzia, reamintim încă o dată că Mis- poate accesa memoria în două moduri La citirea și scrierea cuvintelor de date de octeți, sunt utilizate registrele MAR și MDR Aceste procese sunt prezentate în microinstrucțiuni prin instrucțiunile rd și, respectiv, wr La citirea codurilor operaționale pe un singur octet din fluxul de instrucțiuni, sunt utilizate registrele PC și MBR În microinstrucțiune, acest lucru este arătat de instrucțiunea fetch Ambele tipuri de operații de memorie pot avea loc simultan Totuși, același registru nu poate primi o valoare din memorie și calea datelor în același ciclu Luați în considerare un fragment de program: MAR=SP: rd MDR=H Ca urmare a executării primei microinstrucțiuni, valoarea din memorie este atribuită registrului MDR la sfârșitul celei de-a doua microinstrucțiuni Cu toate acestea, a doua microinstrucțiune atribuie o valoare diferită registrului MDR în același timp Aceste două sarcini sunt în conflict deoarece rezultatele sunt nedefinite Rețineți că fiecare microinstrucțiune trebuie să specifice în mod explicit adresa următoarei microinstrucțiuni Cu toate acestea, se întâmplă adesea ca o micro-comandă să fie apelată de o singură micro-comandă și tocmai cea care se află în linia anterioară Pentru a simplifica munca programatorului, microasamblatorul atribuie de obicei o adresă fiecărei microinstrucțiuni (ordinea adreselor poate să nu se potrivească cu succesiunea microinstrucțiunilor din memoria de control) și completează câmpul NEXT ADDRESS astfel încât ordinea în care sunt executate microinstrucțiunile să corespundă cu ordinea liniilor de microprogram Cu toate acestea, programatorul trebuie uneori să sară, fie condiționat, fie necondiționat A scrie salturi necondiționate este simplu: goto labei O astfel de intrare poate fi inclusă în orice microinstrucțiune Specifică în mod explicit numele următoarei microinstrucțiuni De exemplu, foarte des după Exemplu de implementare a microarhitecturii secvența de microinstrucțiuni se termină cu o revenire la prima instrucțiune a buclei principale, astfel încât ultima instrucțiune din fiecare astfel de secvență conține intrarea goto maini Rețineți că operațiunile normale apar în calea datelor chiar și în timpul execuției microinstrucțiunilor care conțin o instrucțiune goto Fiecare microinstrucțiune are un câmp NEXT ADDRESS Declarația goto îi spune asamblatorului să pună o valoare specială în acest câmp în locul adresei microinstrucțiunii scrise pe linia următoare În principiu, fiecare linie ar trebui să conțină o intrare goto, dar dacă adresa dorită este adresa unei microinstrucțiuni scrise pe linia următoare, goto poate fi omis pentru comoditate Pentru salturi condiționate, avem nevoie de o altă notație Amintiți-vă că JAMN și JAMZ folosesc biții N și, respectiv, Z De exemplu, uneori trebuie să verificați dacă valoarea unui registru nu este egală cu zero Pentru a face acest lucru, se poate trece această valoare prin ALU, stocând-o după aceea în același registru Atunci am scrie TOS=TOS Intrarea pare amuzantă, dar face ceea ce trebuie să facă (setează declanșatorul Z și scrie valoarea în registrul TOS) Pentru lizibilitatea firmware-ului, am extins limbajul MAL prin adăugarea a două noi registre imaginare, N și Z, cărora li se pot atribui valori De exemplu: Z=TOS Această linie trece valoarea registrului TOS prin ALU, setând flip-flop-ul Z (și N), dar nu stochează valoarea în niciunul dintre registre Folosind registrul Z sau N ca țintă îi spune microasamblatorului > să seteze toți biții din câmpul C la (vezi Figura ) Calea datelor trece printr-un ciclu normal, sunt efectuate toate operațiunile normale permise, dar niciunul dintre registre nu este scris Nu contează care registru este țintă, N sau Z Microinstrucțiunile pe care le generează microasamblatorul sunt aceleași (Programatorii care aleg registrul greșit vor fi penalizați pentru o săptămână de lucru pe primul PC IBM la , MHz ) Pentru ca microasamblatorul să seteze bitul JAMZ, scrieți următoarele: f(Z) goto LI; altfel mergi la L Deoarece hardware-ul necesită cei biți cei mai puțin semnificativi din aceste adrese pentru a se potrivi, microasamblatorul trebuie să le atribuie astfel de adrese Pe de altă parte, eticheta L poate fi în oricare dintre cele de cuvinte inferioare ale memoriei de control, astfel încât microasamblatorul poate găsi cu ușurință perechea potrivită Adesea, aceste două afirmații sunt combinate De exemplu: Z=TOS; if(Z) merge la LI; altfel mergi la L Ca urmare a acestei scrieri, MAL va genera o microinstrucțiune în care valoarea registrului TOS este trecută prin ALU, dar nu este stocată nicăieri, deci această valoare setează bitul Z Imediat după încărcarea din ALU, bitul Z este conectat la registrul MSB printr-un circuit SAU, din cauza a ce Capitolul Stratul de microarhitectură adresa următoarei microinstrucțiuni va fi apelată fie pe L , fie pe L Valoarea registrului MPC este stabilizată și o poate folosi pentru a apela următoarea microinstrucțiune În cele din urmă, avem nevoie de o intrare specială pentru a activa bitul JMPC: du-te (MBR SAU vaiii) Această intrare îi spune microasamblatorului să folosească valoarea vaiie pentru câmpul NEXT ADDRESS și să seteze bitul JMPC astfel încât registrul MBR să fie OR în registrul MPC împreună cu valoarea NEXT ADDRESS Dacă valoarea vаіе este , este suficient să scrieți du-te la (MBR) Rețineți că doar cei biți mai puțin semnificativi ai registrului MBR sunt conectați la registrul MPC (vezi Figura ), astfel încât problema extinderii semnului nu se pune aici De asemenea, rețineți că este utilizată valoarea MBR disponibilă la sfârșitul ciclului curent La momentul apelului în micro-instrucțiunea curentă, este deja prea târziu pentru a selecta următoarea micro-instrucțiune Implementarea IJVM folosind microarhitectura Mis- Acum am ajuns deja la punctul în care puteți conecta toate piesele împreună În tabel arată firmware-ul care rulează pe microarhitectura Mіs- și interpretează IJVM Programul este foarte scurt - doar microinstrucțiuni Tabelul are trei coloane Prima coloană conține denumirea simbolică a micro-comandei, a doua - micro-comandă în sine, iar a treia - comentariul După cum am observat deja, secvența de microinstrucțiuni nu corespunde neapărat cu succesiunea de adrese din memoria de control Tabelul Microprogram pentru microarhitectura Mis- Comentariu de operații de microcomandă Maipi PC = PC+ ; aduce; goto(MBR) MBR-ul conține opcode; obține următorul octet; referinţă por goto mâini nu se întâmplă nimic iaddlMAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei iadd H = TOS H = partea de sus a stivei iadd MDR=TOS=MDR+H; wr; goto Mâini Însumarea primelor două cuvinte; scriind suma în poziția de sus a stivei isubl MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei isub H = TOS H = partea de sus a stivei isub MDR=TOS=MDR-H; wr; goto Mâini Scădere; împingând rezultatul în vârful stivei Exemplu de implementare a microarhitecturii Comentariu de operații de microcomandă iapsp MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei iand H = TOS H = partea de sus a stivei iand MDR=TOS=MDR&H; wr; mergeți la Mâini Operațiunea ȘI; împingând rezultatul în vârful stivei ior MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei ior H = TOS H = partea de sus a stivei ior MDR = TOS = MDR SAU H; wr; dus la operațiunea Mâini OR; împingând rezultatul în vârful stivei dup MAR = SP = SP + Incrementați SP cu și copiați rezultatul în registrul MAR dup MDR=TOS; wr; goto Mâini Împingerea unui cuvânt nou pe stivă popi MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei pop Programul așteaptă în timp ce noua valoare a registrului TOS este citită din memorie pop TOS = MDR; goto Mâini Copiați cuvântul nou în registrul TOS swapl MAR = SP = SP - ; rd Setați registrul MAR la SP - ; citește al doilea cuvânt din stivă swap MAR = SP Setați registrul MAR la cuvântul de sus al stivei swap H = MDR; wr Stochează valoarea TOS în registrul H; împingând al doilea cuvânt în vârful stivei swap MDR = TOS Copiați valoarea TOS anterioară în registrul MDR swap MAR = SP - ; wr Setați registrul MAR la SP- ; împingând al doilea cuvânt pe stivă swap TOS=H; mergeți la actualizarea Mâini TOS bipushl SP = MAR = SP + MBR = octet care trebuie împins pe stivă bipush PC = PC + ; aducă Mărește PC-ul cu ; apelați următorul cod de operare bipush MDR=TOS=MBR; wr; goto Mâini Adăugați un bit de semn suplimentar la un octet și împingeți valoarea în stivă iload H = LV MBR conține indice; copiați valoarea LV în N iload MAR=MBRU+H; rd MAR = adresa variabilei locale care urmează să fie împinsă în stivă iload MAR = SP = SP + Registrul SP indică noul vârf al stivei; pregătirea pentru înregistrare iload PC=PC+ ; aduce; wr Creșteți valoarea PC cu ; apel cod următoarea operație; scriind partea de sus a stivei Continuare & Capitolul Stratul de microarhitectură Tabelul (continuare) Comentariu de operații de microcomandă iloadS TOS = MDR; mergeți la actualizarea Mâini TOS istorel H = LV MBR conține indice; copiați valoarea LV în N istore MAR = MBRU + H MAR = adresa variabilei locale pentru a stoca cuvântul din stivă istore MDR=TOS; wr Copiați valoarea TOS în registrul MDR; introducerea de cuvinte istore SP=MAR=SP- ; rd Citiți din stivă al doilea cuvânt de sus store PC=PC+ ; aducă Mărește PC-ul cu ; apelați următorul cod operațional store TOS=MDR; mergeți la actualizarea Mâini TOS widel PC = PC + ; preluați Fetch operand byte sau următorul cod de operație wide goto(MBR SAU x ) Salt la nivel încrucișat la adrese mai înalte widejloadl PC = PC + ;fetch MBR conține primul octet al indexului; apel al doilea octet wide iload H = MBRU " H = primul octet index deplasat la stânga cu biți wide iload H=MBRU SAU H H = index variabil local pe biți wide iload MAR = LV + H; rd; goto iload MAR = adresa variabilei locale de împins în stivă widejstorel PC = PC + ;fetch MBR conține primul octet al indexului; apel al doilea octet wide istore H = MBRU " H = primul octet index deplasat la stânga cu biți wide istore H = MBRU SAU H H = index variabil local pe biți wide istore MAR=LV+H; rd; goto istore MAR = adresa variabilei locale pentru a împinge cuvântul din stivă în Idc w PC = PC + ; fetch MBR conține primul octet al indexului; apel al doilea octet Idc w H = MBRU " H = primul octet index deplasat la stânga cu biți Idc w H = MBRU SAU H H = indice de biți al constantei în setul constant Idc w MAR = H + CPP; rd; goto iload MAR = adresa constantei în setul constant iind H = LV MBR conține indice; copiați valoarea LV în N iinc MAR=MBRU+H; rd Copiați suma valorii LV și a indicelui în registrul MAR; citirea unei variabile ips PC = PC + ; preluați apelul constant Exemplu de implementare a microarhitecturii Comentariu de operații de microcomandă ips H = MDR Copiați variabila în înregistrarea H iips PC = PC + ; preluați Apelați următorul cod operațional ipsb MDR = MBR + H; wr; goto Mâini Scrie suma în registrul MDR; actualizare variabilă gotol OPC = PC - Adresă opcode de stocare goto PC=PC+ ; fetch MBR = primul octet de offset; apel al doilea octet goto H = MBR " Schimbați primul octet rămas cu biți și stocați-l în registrul H goto H = MBRU SAU H H = offset de salt pe biți goto PC=OPC+H; fetch Suma offset și OPC goto goto Mâini Așteptați următorul apel opcode ifltl MAR=SP=SP- ; rd Citiți al doilea cuvânt din partea de sus a stivei iflt OPC = TOS Stocați temporar TOS în OPC iflt TOS = MDR Scrieți noua stivă în TOS iflt N=OPC; dacă(N) a ajuns la T; altfel mergi la F Sari pe bit N ifeq MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei ifeq OPC = TOS Stocați temporar TOS în OPC ifeq TOS = MDR Scrieți noua stivă de sus în TOS ifeq Z=OPC; dacă(Z) a ajuns la T; altfel mergi la F Sari pe bit Z ifjcmpeql MAR=SP=SP- ; rd Citiți al doilea cuvânt din partea de sus a stivei if icmpeq MAR = SP = SP - Setați registrul MAR pentru a citi noul vârf al stivei if icmpeq H = MDR; rd Copiați al doilea cuvânt din stivă în înregistrarea H if icmpeq OPC = TOS Stocați TOS temporar în OPC if icmpeq TOS = MDR Împingeți noua stivă de sus în TOS if icmpeq Z = OPC - H; dacă(Z) a ajuns la T; else goto F Dacă primele două cuvinte sunt egale, sari la T; dacă nu sunt egale, mergeți la F T OPC = PC - ; aduce; goto goto La fel ca gotol; necesare pentru adresa obiectului țintă F PC = PC + Omite primul octet de compensare F PC = PC + ; preluați punctele rs la următorul cod operațional F merge la Mâini Așteptați apelul opcode invoke virtual PC = PC + ; fetch MBR = primul octet al indexului; creșterea PC-ului cu ; apel al doilea octet invoke virtual H = MBRU " Schimbați primul octet cu biți și stocați valoarea în registrul H Continuare & Capitolul Stratul de microarhitectură Tabelul (continuare) Comentariu de operații de microcomandă invoke virtual H = MBRU SAU HH = decalaj indicator al procedurii de la registrul CPP invoke virtual MAR = CPP+H; rd Apelați un pointer de procedură dintr-un set de constante invoke virtual OPC = PC + Stocați temporar valoarea PC în registrul OPC invoke virtual PC = MDR; fetch Registrul PC indică o nouă procedură; apelarea numărului de parametri invoke virtual PC = PC + ; fetch Apelează al doilea octet al numărului de parametri invoke virtual H = MBRU " Schimbați primul octet cu biți și stocați valoarea în registrul H invoke virtual H = MBRU SAU H H = numărul de parametri invoke virtual PC = PC + ; fetch Apelați primul octet din dimensiunea zonei variabile locale invoke virtual TOS=SP - H TOS=adresa OBJREF- invoke virtual TOS=MAR=TOS+ TOS=adresa OBJREF (noua valoare LV) invoke virtual PC = PC + ; fetch Apelați al doilea octet din dimensiunea zonei variabile locale invoke virtual H = MBRU " Schimbați primul octet cu biți și stocați valoarea în registrul H invoke virtual H = MBRU SAU H H = dimensiunea zonei variabile locale invoke virtual MDR = SP + H + ; wr Suprascrieți OBJREF cu indicatorul de legătură invoke virtual MAR = SP = MDR Setați registrele SP și MAR la adresa celulei care conține vechea valoare PC invoke virtual MDR=OPC; wr Salvați valoarea veche a PC-ului peste variabilele locale invoke virtual MAR=SP=SP+ SP indică celula în care este stocată vechea valoare LV invoke virtual MDR = LV; wr Salvați vechea valoare LV peste valoarea salvată pe PC invoke virtual PC = PC + ; fetch Apelați primul cod operațional al noii proceduri invoke virtual LV=TOS; goto Mâini Setați valoarea LV la prima adresă a cadrului variabil local ireturnl MAR=SP=LV; rd Resetează registrele SP și MAR pentru a apela indicatorul de legătură ireturn Procesul de citire ireturnSLV=MAR=MDR; rd Setați registrul LV la pointerul de legătură; numind vechea valoare a RS ireturn MAR = LV + Setați registrul MAR să citească vechea valoare a LV Exemplu de implementare a microarhitecturii Comentariu de operații de microcomandă ireturn PC = MDR; rd; preluați PC-ul de recuperare; apelați următorul cod operațional ireturn MAR = SP Setați MAR pentru a scrie TOS ma intorc? LV = MDR LV Recovery ireturn MDR=TOS; wr; goto Mâini Stocați rezultatul în partea de sus a stivei Alegerea numelor pentru majoritatea registrelor prezentate în fig ar trebui să fie evident Registrele CPP (Constant Pool Pointer - pointer către un set de constante), LV (Local paralel - variabilă locală) și SP (Stack Pointer - stack pointer) conțin pointeri către adresele setului de constante, cadrul variabilelor locale și elementul de sus de pe stivă, respectiv, și registrul PC (Program Counter - program counter) conține adresa octetului care urmează să fie apelat din fluxul de comandă în continuare MBR (Memory Buffer Register) este un registru de un octet care conține octeții fluxului de comenzi care provin din memorie pentru interpretare TOS și OPC sunt registre suplimentare Ele sunt descrise mai jos În anumite momente, fiecare dintre aceste registre trebuie să conțină o anumită valoare Cu toate acestea, fiecare dintre ele, dacă este necesar, poate fi folosit și ca unul temporar La începutul și la sfârșitul fiecărei instrucțiuni, registrul TOS (Top Of Stack) conține valoarea adresei de memorie indicată de SP Această valoare este redundantă deoarece poate fi întotdeauna citită din memorie, dar dacă valoarea este stocată într-un registru, nu este necesar accesul la memorie Pentru unele instrucțiuni, utilizarea registrului TOS presupune, dimpotrivă, mai multe accesări la memorie De exemplu, instrucțiunea POP renunță la cuvântul de sus al stivei și, prin urmare, trebuie să preia noua valoare a vârfului stivei din memorie și să o scrie în registrul TOS ORS - registru temporar Nu are un scop anume Poate, de exemplu, să stocheze adresa unui cod operațional pentru o instrucțiune de ramură în timp ce valoarea PC este incrementată pentru a accesa parametrii Este, de asemenea, folosit ca un registru temporar în instrucțiunile de ramificare condiționată La fel ca toți interpreții, firmware-ul prezentat în tabel include o buclă principală care apelează, decodifică și execută comenzile programului interpretat (în acest caz, comenzi IJVM) Bucla principală începe cu linia Mâini și anume cu invariantul (afirmația) că adresa celulei de memorie care conține codul operației a fost deja încărcată în registrul PC Mai mult, acest cod operațional a fost deja apelat din memorie în registrul MBR Când ne întoarcem la această celulă, trebuie să fim siguri că valoarea PC a fost deja actualizată pentru a indica următorul cod operațional, iar codul operațional în sine a fost deja apelat din memorie în MBR Această secvență de acțiuni are loc la începutul fiecărei comenzi, așa că este important să o mențineți cât mai scurtă posibil Prin dezvoltarea hardware-ului și software-ului microarhitecturii Mis- , am reușit să reducem ciclul principal la o singură microinstrucțiune De fiecare dată când această microinstrucțiune este executată, codul pentru operația de efectuat este deja în MBR Acest microco Capitolul Stratul de microarhitectură Manda, în primul rând, face o tranziție la microcodul care efectuează această operație și, în al doilea rând, apelează următorul octet după codul de operație, care poate fi fie un operand, fie un cod de operație Acum putem explica motivul principal pentru care fiecare micro-instrucțiune specifică în mod explicit următoarea micro-instrucțiune, iar succesiunea comenzilor poate să nu corespundă cu ordinea locației lor în memorie Toate adresele de memorie de control corespunzătoare codurilor operaționale trebuie rezervate pentru primul cuvânt al interpretului de instrucțiuni corespunzător Deci, din Tabel În Figura - , vedem că programul care interpretează instrucțiunea POP începe de la locația x , iar programul care interpretează instrucțiunea DUP începe la locația x (Cum știe MAL să plaseze comanda POP în locația x este unul dintre misterele universului Probabil că există un fișier undeva care îi spune să facă acest lucru ) Din nefericire, programul care interpretează instrucțiunea POP include trei microinstrucțiuni, așa că dacă acestea sunt plasate în memorie secvențial, acest program va fi amestecat cu începutul instrucțiunii DUP Deoarece toate adresele de memorie de control care corespund codurilor operaționale sunt rezervate, toate microinstrucțiunile care urmează primei microinstrucțiuni din fiecare secvență trebuie plasate între adresele rezervate Din acest motiv, există atât de multe "sărituri" încât ar fi nerezonabil să inserați o microinstrucțiune de salt de fiecare dată pentru a sări de la o secvență de adrese la alta Pentru a înțelege cum funcționează interpretul, să presupunem că registrul MBR conține valoarea x , adică opcode-ul IADD (vezi Tabelul ) În bucla principală, care constă dintr-o microinstrucțiune, se execută următoarele: Se mărește valoarea registrului PC, după care conține adresa primului octet după opcode Începe transferul următorului octet în registrul MBR Acest octet va fi necesar mai devreme sau mai târziu, fie ca operand al instrucțiunii IJVM curente, fie ca cod pentru următoarea operație (cum este cazul unei instrucțiuni IADD care nu are operanzi) Se face un salt la adresa cuprinsă în MBR la începutul ciclului Mâini Numărul adresei este egal cu valoarea codului operației care este în curs de executare Această adresă este plasată acolo de către microinstrucțiunea anterioară Rețineți că valoarea care este apelată din memorie în timpul acestei microinstrucțiuni nu joacă niciun rol în tranziția stratului Aici este apelat următorul octet, deci va fi disponibil până la sfârșitul celei de-a treia microinstrucțiuni Deși octetul specificat poate să nu fie necesar în acel moment, oricum va fi necesar într-o zi, așa că nu este rău în faptul că apelul are loc aici Dacă toți biții octetului din MBR sunt (acesta este codul operațional pentru instrucțiunea NOP), atunci următoarea microinstrucțiune este pori, care este apelată din locația Deoarece această instrucțiune nu efectuează nicio operație, pur și simplu sare la începutul buclei principale, unde aceeași secvență de acțiuni, dar cu un nou cod de operare în MBR Exemplu de implementare a microarhitecturii Subliniem încă o dată că micro-instrucțiunile date în tabel nu sunt localizate secvenţial în memorie, iar microinstrucţiunea Mâini nu se află deloc în celula cu adresa (deoarece această celulă ar trebui să conţină microinstrucţiunea pori) Sarcina microasamblatorului este de a plasa fiecare instrucțiune în celula corespunzătoare și de a le lega în secvențe scurte folosind câmpul NEXT ADDRESS Fiecare secvență începe la o adresă care se potrivește cu valoarea numerică a codului operațional (de exemplu, instrucțiunea POP începe la adresa x ), dar restul secvenței poate fi în orice locație din memoria de control, iar aceste locații nu sunt neapărat contigue Acum luați în considerare comanda IADD Începe cu microinstrucțiunea iaddl Trebuie să faceți următoarele: Valoarea registrului TOS este deja acolo, dar al doilea cuvânt al stivei trebuie apelat din memorie Valoarea registrului TOS trebuie adăugată celui de-al doilea cuvânt al stivei, apelat din memorie Rezultatul care este împins pe stivă trebuie să fie stocat în memorie și în registrul TOS Pentru a apela un operand din memorie, este necesar să reduceți indicatorul de stivă și să îl scrieți în registrul MAR Rețineți că această adresă va fi folosită pentru scrierile ulterioare Mai mult, deoarece această locație de memorie va deveni noul vârf al stivei, această valoare trebuie să fie atribuită registrului SP Prin urmare, este posibil să se determine noua valoare a SP și MAR, să scadă valoarea lui SP cu și să o scrie în ambele registre într-o singură operație Toate aceste acțiuni sunt efectuate în prima buclă (iadl) Aici este inițiată operația de citire În plus, registrul MPC își obține valoarea din câmpul NEXT ADDRESS al microinstrucțiunii iaddl Aceasta este adresa microinstrucțiunii iadd Apoi iadd este citit din memoria de control În a doua buclă, în timp ce operandul este citit din memorie, copiem cuvântul de sus al stivei din TOS în H, unde va fi disponibil pentru adăugare când procesul de citire este finalizat La începutul celui de-al treilea ciclu (iadd ) MDR conține al doilea termen, numit din memorie În această buclă, se adaugă la valoarea registrului H, iar rezultatul este stocat înapoi în registrele MDR și TOS În plus, începe o operație de scriere, în timpul căreia noul cuvânt de sus al stivei este stocat în memorie În această buclă, comanda goto atribuie adresa lui Mâini registrului MPC și astfel revenim la punctul de plecare și putem începe următoarea operație Dacă următorul cod operațional IJVM în prezent în MBR este x (ISUB), atunci se repetă aproape aceeași secvență de acțiuni După executarea Mâini, controlul este transferat către microinstrucțiunea cu adresa x (isubl) Această micro-instrucțiune este urmată de i sub , isub și apoi din nou Mâini Singura diferență între aceasta și secvența anterioară este că, în bucla i sub , conținutul registrului H nu este adăugat la valoarea MDR, ci scade din acesta Instrucțiunea IAND este identică cu instrucțiunile IADD și ISUB, doar în acest caz primele două cuvinte ale stivei sunt supuse înmulțirii logice (operație AND), și nu Capitolul Stratul de microarhitectură adunat si nu scazut Ceva similar se întâmplă în timpul execuției comenzii I R Dacă codul operațional se potrivește cu o instrucțiune DUP, POP sau SWAP, atunci trebuie utilizat o stivă Instrucțiunea DUP dublează cuvântul de sus al stivei Deoarece valoarea acestui cuvânt este deja în registrul TOS, trebuie doar să măriți SP cu După aceea, registrul SP va indica noua adresă Această nouă celulă este locul unde este scrisă valoarea registrului TOS Instrucțiunea POP este, de asemenea, destul de simplă: trebuie doar să micșorați valoarea SP cu pentru a elimina cuvântul de sus al stivei Cu toate acestea, după aceea, trebuie să citiți noul cuvânt de sus al stivei din memorie și să îl scrieți în registrul TOS În cele din urmă, instrucțiunea SWAP schimbă valorile a două locații de memorie, și anume primele două cuvinte ale stivei Registrul TOS conține deja una dintre aceste valori, deci nu este nevoie să o citiți (valoarea) din memorie Vom discuta despre această comandă mai detaliat puțin mai târziu Comanda BIPUSH este mai complicată decât cele anterioare deoarece codul operațional este urmat de un octet, așa cum se arată în Figura Acest octet este un număr întreg cu semn Octetul specificat, care a fost transferat către MBR în timpul execuției microinstrucțiunii Mâini, trebuie extins la de biți (extindere semn) și copiat în MDR Valoarea SP este apoi incrementată cu și copiată în MAR, permițând ca operandul să fie împins în partea de sus a stivei Acest operand trebuie de asemenea copiat în registrul TOS Rețineți că valoarea registrului RS trebuie mărită cu , astfel încât microinstrucțiunea Mat pi să conțină codul pentru următoarea operație BIPUSH ( x ) octet Orez Format de comandă BIPUSH Acum luați în considerare comanda ILOAD În această instrucțiune, codul operațional este, de asemenea, urmat de un octet (Fig a), dar acest octet este un index fără semn folosit pentru a găsi cuvântul în spațiul variabil local pentru a fi introdus în stivă Deoarece aici există doar octet, sunt disponibile doar = de cuvinte, și anume primele de cuvinte ale spațiului variabil local Instrucțiunea ILOAD necesită atât o citire (pentru a apela un cuvânt) cât și o scriere (pentru a-l împinge în stivă) Pentru a determina adresa de citire, trebuie să adăugați offset-ul, care este stocat în registrul MBR (acesta este registrul tampon de memorie), la conținutul registrului LV Registrele MBR și LV pot fi accesate numai prin magistrala B, astfel încât mai întâi valoarea LV este copiată în registrul H (în bucla iloadl), apoi se adaugă valoarea MBR Rezultatul însumării este copiat în registrul MAR și începe procesul de citire (în ciclul i oad ) ILOAD ( x ) Index A WIDE ( xC ) ILOAD ( x ) Primul octet de index Al doilea octet de index b Orez Comanda ILOAD cu index de un octet (a); Comanda WIDE ILOAD cu index pe doi octeți (b) Exemplu de implementare a microarhitecturii Totuși, aici MBR-ul este utilizat diferit decât în comanda BIPUSH, unde octetul este extins prin semn În cazul unui index, offset-ul este întotdeauna pozitiv, deci octetul offset trebuie să fie un întreg fără semn (spre deosebire de BIPUSH, unde octetul este un întreg cu semn de biți) Interfața dintre MBR și magistrala B este concepută pentru a permite ambele operațiuni În cazul instrucțiunii BIPUSH (unde octetul este un număr întreg cu semn de biți), bitul din stânga al valorii MBR este copiat în cei de biți cei mai semnificativi ai magistralei B În cazul instrucțiunii ILOAD (unde octetul este un întreg fără semn pe biți), cei mai importanți de biți anvelopele B sunt umpluți cu zerouri Două semnale speciale ajută la determinarea care dintre aceste două operații să fie efectuată (vezi Figura ) În firmware, cuvântul MBR indică un octet semnat (ca în comanda bipush ), iar MBRU indică un octet nesemnat (ca în comanda i oad ) În timp ce se așteaptă ca un operand să sosească din memorie (la momentul i oad ), valoarea registrului SP este incrementată cu pentru a scrie noul vârf al stivei Această valoare este copiată și în registrul MAR (necesar pentru a împinge operandul în stivă) Valoarea PC este apoi mărită din nou cu pentru a apela următorul cod operațional (microinstrucțiune oad ) În cele din urmă, valoarea MDR este copiată în registrul TOS pentru a indica noul cuvânt de sus al stivei (microinstrucțiune iioad ) Comanda ISTORE este opusul comenzii ILOAD (cuvântul de sus este scos din stivă și stocat într-o locație de memorie a cărei adresă este egală cu suma valorii registrului LV și indexul acestei comenzi) În acest caz, se folosește același format ca și în comanda ILOAD (vezi Fig , a), doar că aici opcode-ul nu este x , ci x Deoarece cuvântul de sus al stivei este deja cunoscut (este în registrul TOS), acesta poate fi stocat imediat în memorie Cu toate acestea, noul cuvânt de sus al stivei mai trebuie apelat din memorie, așa că sunt necesare atât o citire, cât și o scriere, deși aceste operațiuni pot fi efectuate în orice ordine (sau chiar simultan, dacă este posibil) Comenzile ILOAD și ISTORE au acces doar la primele de variabile locale Deși acest spațiu este suficient pentru majoritatea programelor, trebuie totuși să puteți accesa orice variabilă locală, indiferent unde se află în cadru Pentru a activa acest lucru, IJVM utilizează aceeași facilitate ca și JVM, un cod operațional WIDE special (numit octet de prefix) urmat de un cod operațional ILOAD sau ISTORE Când se întâlnește o astfel de secvență, formatul comenzii ILOAD sau ISTORE se modifică; conform noului format, codul operațional este urmat de un index de biți în loc de unul de biți, așa cum se arată în Fig b Comanda WIDE este decodificată în mod obișnuit În primul rând, există o tranziție la microinstrucțiunea widel, care se ocupă de codul operațional al instrucțiunii WIDE Deși codul operațional care urmează să fie extins este deja prezent în MBR, microinstrucțiunea largă apelează primul octet după codul operațional deoarece logica firmware-ului o cere Apoi se face o altă tranziție între niveluri, dar de data aceasta octetul care urmează WIDE este folosit pentru tranziție Cu toate acestea, deoarece instrucțiunea WIDE ILOAD necesită un set diferit de microinstrucțiuni decât ILOAD, instrucțiunea WIDE ISTORE necesită o microinstrucțiune diferită de ISTORE și așa mai departe, codul operațional nu poate fi utilizat ca adresă țintă într-un salt de strat Capitolul Stratul de microarhitectură În schimb, microinstrucțiunea largă adaugă în mod logic adresa x și codul operațional în registrul MPC Ca urmare, interpretarea WIDE LOAD începe la adresa x (nu x ), interpretarea WIDE ISTORE începe la adresa x (nu x ) și așa mai departe Astfel, fiecare opcode WIDE începe la o adresă care se află în memoria de control la (adică x ) cuvinte mai mari decât opcode-ul normal corespunzător Secvența inițială de microinstrucțiuni pentru ILOAD și WIDE ILOAD este prezentată în fig Orez Începutul secvenței de microinstrucțiuni pentru comenzile ILOAD și WIDE ILOAD Adresele sunt date ca exemplu Comanda WIDE ILOAD diferă de comanda obișnuită ILOAD doar prin faptul că indexul său este format din doi octeți de index Fuziunea și însumarea ulterioară a acestor octeți trebuie să aibă loc în etape, în timp ce primul octet de index este deplasat la stânga cu biți și copiat în H Deoarece indexul este un întreg fără semn, aici este folosit registrul MBRU (cele cele mai multe biții semnificativi sunt umpluți cu zerouri) Apoi se adaugă al doilea octet de index (operația de adăugare este identică cu operația de îmbinare, deoarece octetul mic al registrului H este în prezent ), asigurându-se în același timp că nu există transport între octeți Rezultatul este din nou stocat în registrul H Din acest moment, au loc aceleași acțiuni ca și în comanda standard ILOAD În loc să duplicăm ultimele micro-instrucțiuni (PoacI la iload ) ale comenzii ILOAD, am sărit pur și simplu de la wideiload la i oad Rețineți că în timpul execuției acestei instrucțiuni, valoarea PC-ului trebuie să fie incrementată cu de două ori, astfel încât la sfârșit acest registru să indice următorul cod operațional Comanda ILOAD incrementează valoarea o dată; secvența de comandă WIDE ILOAD incrementează și această valoare o dată Exemplu de implementare a microarhitecturii Aceeași situație apare atunci când se execută WIDEISTORE După primele patru microinstrucțiuni (de la wide istorel la wideistore ) secvența acțiunilor este aceeași ca în instrucțiunea ISTORE după primele două microinstrucțiuni, așa că sărim de la wide istore la store În continuare, ne vom uita la comanda LDCW Există două diferențe între această comandă și ILOAD În primul rând, conține un offset de biți nesemnat (ca versiunea extinsă a ILOAD), iar în al doilea rând, această instrucțiune este indexată din registrul CPP și nu din LV, deoarece citește valoarea din setul constant și nu din cadru variabil local (Există și o formă scurtă a acestei comenzi, LDC, dar nu am inclus-o în mașina IJVM, deoarece forma lungă conține toate variantele formei scurte, deși durează octeți în loc de ) Comanda IINC este singura comandă, în afară de ISTORE, care poate modifica o variabilă locală Include doi operanzi de câte un octet fiecare, așa cum se arată în Fig IINC ( x ) Constanta indexului Orez Instrucțiunea IINC conține două câmpuri de operanzi Câmpul index este necesar pentru a determina offset-ul de la începutul cadrului variabil local Instrucțiunea citește această variabilă, o incrementează cu o constantă (constanta este conținută în al doilea câmp) și plasează rezultatul înapoi în aceeași locație de memorie Rețineți că constanta este un număr de biți cu semn între - și + JVM acceptă o versiune extinsă a acestei instrucțiuni, în care fiecare operand are octeți Luați în considerare prima comandă de salt, GOTO Această instrucțiune modifică valoarea registrului PC, astfel încât următoarea instrucțiune IJVM să fie în locația de memorie la adresa calculată prin adăugarea unui offset de biți (semnat) la adresa opcode-ului GOTO Dificultatea aici este că offset-ul este legat de valoarea din registrul PC la începutul decodării instrucțiunii, și nu de cea conținută în același registru după apelul offset de octeți Pentru a înțelege mai bine acest lucru, priviți Fig , a Aceasta arată situația care are loc la începutul ciclului Mâini Opcode-ul este deja în MBR, dar valoarea PC nu a crescut încă Pe fig b vedem situația la începutul buclei gotol În acest caz, valoarea PC a fost deja crescută cu , iar primul octet de compensare a fost deja transferat la MBR În următoarea microinstrucțiune (Fig , c), valoarea anterioară a RS, care indică codul operației, este stocată în registrul OPC Această valoare trebuie salvată, deoarece de ea, și nu de valoarea curentă a PC-ului, depinde offset-ul comenzii GOTO Și pentru asta este registrul OCR Micro-instrucțiunea goto începe să apeleze al doilea octet de compensare, ceea ce duce la situația prezentată în Fig d (microinstrucțiune goto ) După ce primul octet offset este deplasat la stânga cu biți și copiat în registrul H, trecem la microinstrucțiunea goto (Fig , E) Acum avem primul octet offset, deplasat la stânga, este în registrul H, al doilea octet offset este în registru Capitolul Stratul de microarhitectură șir MBR, iar baza offset este în registrul OPC În microinstrucțiunea goto , adăugând offset-ul complet de biți la baza offset-ului, obținem o nouă adresă, care este plasată în registrul PC-ului Rețineți că în goto folosim MBRU în loc de MBR pentru că nu avem nevoie de extinderea semnului celui de-al doilea octet Un offset de biți este construit prin adăugarea logică (operație SAU) a celor două jumătăți În cele din urmă, deoarece programul necesită ca codul pentru următoarea operație să fie plasat în MBR înainte de a sări la Mâini, trebuie să apelăm acest cod Ultima buclă, goto , este necesară pentru a plasa în timp datele din memorie în registrul MBR p+ p+ p+ p Offset octet Offset octet Offset octet Offset octet Offset octet Offset byte Offset byte Offset byte Offset byte Offset byte GOTO ( xA ) GOTO ( xA ) GOTO ( xA ) GOTO ( xA ) GOTO ( xA ) Registre < octet i PC OPC MBR N n n+ n+ n+ n+ p p p xA Offset octet Offset octet Offset octet Offset octet Offset " a B C D E Orez Situaţia la începutul execuţiei diverselor microinstrucţiuni: Mâini (a); gotol (b); goto (in); goto (g); du-te la (d) Offset-urile utilizate în comanda goto sunt semnate de ori, de la - la + Aceasta înseamnă că nu sunt posibile sărituri la distanțe suplimentare Această proprietate poate fi privită fie ca un defect, fie ca o caracteristică a mașinii IJVM (și, de asemenea, a JVM-ului) Cei care consideră acest lucru un defect vor spune că mașina JVM nu ar trebui să restricționeze programatorul Cei care consideră aceasta o caracteristică vor spune că munca multor programatori ar fi avansat dramatic dacă ar fi avut următorul mesaj al compilatorului în coșmarurile lor: Programul este prea lung și complicat Trebuie să o rescrieți Compilarea sa încheiat Exemplu de implementare a microarhitecturii Din păcate (acesta este punctul nostru de vedere), acest mesaj va apărea doar dacă propoziția el se sau apoi depășește KB, adică cel puțin de pagini de text Java Acum luați în considerare cele trei instrucțiuni de salt condiționat: IFLT, IFEQ și IFICMPEQ Primele două scot cuvântul de sus din stivă și sară dacă acel cuvânt este mai mic de sau, respectiv, egal cu Instrucțiunea IF ICMPEQ scoate primele două cuvinte din stivă și sare dacă sunt egale În toate cele trei cazuri, este necesar să citiți noul cuvânt de sus al stivei și să îl plasați în registrul TOS Aceste trei comenzi sunt similare Mai întâi, operandul sau operanzii sunt plasați în registre, apoi noul cuvânt de sus al stivei este scris în TOS, iar în final se face comparația și se face un salt Să ne uităm mai întâi la IFLT Cuvântul care trebuie verificat este deja în registrul TOS, dar deoarece instrucțiunea IFLT scoate cuvântul din stivă, noul vârf al stivei trebuie citit din memorie și stocat în registrul TOS Procesul de citire începe în microinstrucțiunea ifltl În timpul i fl t , cuvântul verificat este stocat în registrul OPC, astfel încât noua valoare poate fi plasată imediat în registrul TOS, iar valoarea anterioară nu se va pierde În bucla if , noul cuvânt de sus al stivei, care este deja în MDR, este copiat în registrul TOS În final, în bucla flt , cuvântul de testat (este în registrul OPC) este trecut prin ALU fără a salva rezultatul, după care se verifică bitul N Dacă condiția este adevărată, atunci au loc aceleași acțiuni ca la începutul comenzii GOTO și apoi se efectuează tranziția la goto Dacă condiția nu este adevărată, este necesară o scurtă secvență de micro-instrucțiuni (F, F și F ) pentru a sări peste restul instrucțiunii (shift), a reveni la Mâini și a trece la următoarea instrucțiune Instrucțiunea IFEQ este similară cu instrucțiunea IFLT, cu excepția faptului că bitul Z este utilizat în loc de bitul N În ambele cazuri, asamblatorul trebuie să se asigure că adresele microinstrucțiunilor F și T diferă doar de bitul din stânga Instrucțiunea IF ICMPEQ este în general similară cu instrucțiunea IFLT, doar că aici trebuie citit și al doilea operand Al doilea operand este stocat în registrul H în timpul buclei f icmpeq , unde începe citirea noului cuvânt de sus al stivei Cuvântul de sus actual al stivei este stocat în OPC, iar cel nou este încărcat în registrul TOS În cele din urmă, microinstrucțiunea i f i cmpeq este aceeași cu feq Acum luați în considerare comenzile INVOKEVIRTUAL și IRETURN După cum s-a menționat în secțiunea "Set de comenzi IJVM" din secțiunea "Exemplu Arhitectură set de comenzi - IJVM", acestea sunt utilizate pentru a apela și a ieși dintr-o procedură Instrucțiunea INVOKEVIRTUAL este o secvență de de microinstrucțiuni Aceasta este cea mai complexă comandă a mașinii IJVM Secvența de acțiuni la executarea acestei comenzi este ilustrată în Fig Offset-ul de biți este utilizat pentru a determina adresa procedurii apelate Numărul adresei procedurii este într-un set de constante Trebuie amintit că primii octeți ai fiecărei proceduri nu sunt instrucțiuni, ci doi pointeri de biți Primul dintre ei vă permite să aflați numărul de parametri (inclusiv OBJREF - vezi Figura ), al doilea - dimensiunea zonei variabilelor locale (în cuvinte) Aceste câmpuri sunt apelate de ori- Capitolul Stratul de microarhitectură port inline și sunt combinate în același mod ca un offset de biți într-o singură instrucțiune Apoi sunt necesare informații speciale pentru a restabili starea anterioară a mașinii - adresa de la începutul fostei zone variabile locale și vechea valoare a registrului PC Acestea sunt stocate direct deasupra zonei variabile locale sub noul stivă În cele din urmă, următorul cod operațional este apelat, registrul PC este incrementat, bucla Mâini sare și începe următoarea instrucțiune IRETURN este o instrucțiune simplă, fără operanzi Această comandă accesează pur și simplu primul cuvânt al zonei variabile locale pentru a prelua informații pentru revenirea la starea anterioară Apoi restaurează valorile anterioare ale registrelor SP, LV și PC și copiază rezultatul executării procedurii din noua stivă în stiva anterioară, așa cum se arată în Fig Dezvoltare la nivel de microarhitectură Atunci când proiectați un strat de microarhitectură (ca și în dezvoltarea altor straturi), există compromisuri constante Un computer are multe caracteristici importante: viteza, costul, fiabilitatea, ușurința în utilizare, cantitatea de energie consumată, dimensiunea fizică Atunci când proiectați un procesor central, alegerea corectă între viteză și cost este foarte importantă În această secțiune, vom explora această dilemă în detaliu, vom arăta avantajele și dezavantajele fiecărei opțiuni, precum și cât de multă performanță poate fi atinsă, cât va costa computerul și cât de complex va fi hardware-ul Performanță și cost Odată cu dezvoltarea tehnologiei, viteza computerelor crește rapid Practic, acest proces are loc datorită creșterii vitezei microcircuitelor, deși factorul arhitectural are și el o anumită influență asupra acestuia Există trei abordări principale care vă permit să creșteți viteza operațiunilor: Reducerea numărului de cicluri necesare executării unei instrucțiuni Simplificarea organizării mașinii astfel încât ciclul să poată fi scurtat Executarea simultană a mai multor operațiuni Primele două abordări sunt evidente, dar există un număr mare de opțiuni de proiectare diferite care pot afecta semnificativ numărul de cicluri, perioada sau (cel mai adesea) ambele În această secțiune, vom oferi un exemplu despre modul în care codificarea și decodarea unei operații poate acționa asupra unei bucle Numărul de cicluri necesare pentru a finaliza un set de operații se numește lungimea căii Uneori, lungimea căii poate fi redusă cu hardware suplimentar De exemplu, dacă schema de increment este adăugată la registrul RS Dezvoltare la nivel de microarhitectură ment (de fapt, sumatorul, în care una dintre intrări este conectată constant la una), atunci nu va mai trebui să folosim ALU pentru a crește valoarea PC-ului cu unul și, prin urmare, numărul de cicluri va fi redus Cu toate acestea, această abordare nu este atât de eficientă pe cât ne-am dori Adesea, în același ciclu în care valoarea PC-ului crește cu , există și o operație de citire, iar instrucțiunea următoare nu poate începe oricum mai devreme, deoarece depinde de datele care trebuie să vină din memorie Reducerea numărului de cicluri necesare pentru a invoca o instrucțiune necesită mai mult decât simpla adăugare a unui circuit care crește PC-ul cu Pentru a crește viteza de invocare a unei instrucțiuni, trebuie luată o a treia abordare: execuția în paralel a instrucțiunilor Este foarte eficient să se separe circuitele pentru apelarea instrucțiunilor (port de memorie de biți și registre PC și MBR) dacă acest bloc este independent funcțional de calea principală a datelor Astfel, poate apela el însuși următorul cod operațional sau operand Poate chiar va rula asincron cu o altă parte a procesorului și va apela una sau mai multe instrucțiuni în avans Unul dintre procesele cele mai consumatoare de timp la executarea instrucțiunilor este apelarea unui offset de octeți și stocarea acestuia în registrul H în pregătirea pentru adăugare (de exemplu, când treceți la PC ± n octeți) O soluție posibilă este creșterea portului de memorie la biți, dar acest lucru va complica semnificativ operațiunea, deoarece cei biți necesari se pot suprapune cu granițele cuvintelor, atunci chiar și citirea a de biți din memorie într-un singur acces nu va duce neapărat la apelarea ambilor octeți nevoie Rularea mai multor operațiuni în același timp este cea mai productivă abordare Vă permite să creșteți semnificativ viteza computerului Chiar și o simplă suprapunere între apelarea și executarea unei comenzi este extrem de eficientă Cu tehnologii mai complexe, este permisă executarea mai multor comenzi în același timp În general, această idee stă la baza proiectelor moderne de computere În continuare, vom discuta câteva dintre tehnicile care fac din această abordare o realitate Viteza este pe o parte a scalei, costul pe cealaltă Valoarea poate fi măsurată într-o varietate de moduri, dar este foarte dificil să se ofere o definiție precisă a valorii În acele vremuri când procesoarele erau asamblate din componente discrete, era suficient să numărăm numărul total al acestor componente În prezent, un întreg procesor se potrivește pe un singur cip, dar cipurile mai mari și mai complexe sunt mult mai scumpe decât cipurile mai mici, mai simple Puteți număra componente individuale (tranzistoare, supape, blocuri funcționale), dar de obicei acest număr nu este la fel de important ca dimensiunea zonei de contact necesară pentru circuitul integrat Cu cât parcela este mai mare, cu atât cip este mai mare Iar costul unui cip crește mult mai repede decât spațiul pe care îl ocupă Din acest motiv, designerii măsoară adesea costul în unități "imobiliare", adică în ceea ce privește spațiul necesar pentru cip (presupunând că suprafața este măsurată în picoacri) În istoria industriei calculatoarelor, unul dintre cele mai elaborate microcircuite este sumatorul binar Mii au fost implementate Capitolul Stratul de microarhitectură proiecte, iar cele mai rapide sumatoare binare sunt semnificativ mai rapide decât cele mai lente Desigur, adaoarele de mare viteză sunt mult mai complicate decât cele de viteză mică Inginerii de sisteme trebuie să se mulțumească cu un anumit echilibru între viteză și spațiu Adderul nu este singura componentă care permite diverse opțiuni de design Practic, orice componentă a sistemului poate fi proiectată să funcționeze la o viteză mai mare sau mai mică și, desigur, diferitele modele vor varia ca cost Sarcina principală a dezvoltatorului este de a determina acele componente ale sistemului, a căror îmbunătățire poate avea un impact maxim asupra vitezei computerului Este interesant de remarcat faptul că, dacă orice componentă este înlocuită cu una mai rapidă, acest lucru nu va duce neapărat la o creștere a performanței generale În următoarele subsecțiuni, vom analiza câteva aspecte ale dezvoltării și posibilele compromisuri între cost și performanță Unul dintre factorii cheie în determinarea vitezei unui generator de ceas este numărul de pași care trebuie parcurși într-un ciclu Evident, cu cât trebuie făcute mai multe acțiuni, cu atât ciclul este mai lung Lucrurile nu sunt însă atât de simple, deoarece hardware-ul este capabil să efectueze unele operații în paralel, așa că, în realitate, lungimea ciclului depinde de numărul de operații consecutive dintr-un ciclu De asemenea, trebuie luată în considerare cantitatea de decodificare Uită-te la fig Amintiți-vă că valoarea unuia dintre cele nouă registre poate fi transmisă ALU și este nevoie de doar biți într-o microinstrucțiune pentru a determina ce registru să selectați Din păcate, aceste economii au un cost Circuitul decodor introduce o întârziere suplimentară computerului Aceasta înseamnă că, indiferent de registru pe care îl alegem, acesta va primi comanda (și va transfera conținutul în magistrala B) puțin mai târziu Prin urmare, ALU primește semnalele de intrare și emite rezultatul și cu o ușoară întârziere În consecință, acest rezultat este trimis și către magistrala C pentru scriere într-unul dintre registre puțin mai târziu Deoarece latența este adesea un factor care determină durata ciclului, aceasta înseamnă că generatorul de ceas nu va putea funcționa la acea viteză și întregul computer va trebui să funcționeze puțin mai lent Astfel, există o anumită relație între viteză și cost Dacă fiecare cuvânt din memoria de control este scurtat cu biți, aceasta va reduce viteza generatorului Atunci când proiectează un computer, un inginer trebuie să țină cont de scopul acestuia pentru a face alegerea corectă Nu este recomandat să folosiți un decodor într-un computer cu performanțe ridicate, dar pentru o mașină ieftină este destul de potrivit Reducerea lungimii traseului Microarhitectura Mis- are o structură relativ simplă și este destul de rapidă, deși aceste două caracteristici sunt foarte greu de reconciliat În general, mașinile simple nu sunt de mare viteză, ci de mare viteză Dezvoltare la nivel de microarhitectură masinile sunt destul de complexe Procesorul Mis- folosește un minim de hardware: registre, un simplu ALU (vezi Fig ), duplicat de de ori, un decodor, un circuit de deplasare, memorie de control și câteva elemente de conectare Pentru a construi întregul sistem sunt necesari mai puțin de de tranzistori, plus memoria de control (ROM), plus memoria principală (RAM) Am arătat deja cum IJVM poate fi implementat în firmware folosind un minim de hardware Acum să ne uităm la opțiunile alternative Vom analiza mai întâi modalitățile prin care putem reduce numărul de microinstrucțiuni dintr-o instrucțiune (adică cum putem reduce lungimea căii), apoi vom trece la alte abordări Îmbinarea buclei de interpret cu firmware-ul În microarhitectura Mic- , bucla principală constă dintr-o microinstrucțiune care trebuie executată la începutul fiecărei instrucțiuni IJVM În unele cazuri, poate fi suprascris de comanda anterioară Într-un fel, această idee și-a primit deja întruchiparea Reamintim că în timpul ciclului Mâini, codul pentru următoarea operație este deja în MBR Acest opcode este apelat fie în timpul ciclului principal anterior (dacă instrucțiunea anterioară nu avea operanzi), fie în timpul execuției instrucțiunii anterioare Această idee poate fi dezvoltată în continuare În unele cazuri, bucla principală poate fi redusă la zero Se întâmplă în felul următor Să luăm în considerare fiecare secvență de microinstrucțiuni care se termină cu o tranziție la Mâini De fiecare dată când bucla principală poate fi adăugată la sfârșitul acestei secvențe (mai degrabă decât la începutul următoarei), tranziția este duplicată de mai multe ori (dar întotdeauna cu același set de ținte) În unele cazuri, microinstrucțiunea de microarhitectură Mis- poate fuziona cu microinstrucțiunile anterioare, deoarece aceste instrucțiuni nu sunt întotdeauna utilizate pe deplin În tabel arată secvența de execuție a microinstrucțiunilor pentru comanda POP Ciclul principal merge înaintea fiecărei comenzi și după fiecare comandă, în tabel acest ciclu este afișat numai după comanda POP Rețineți că execuția acestei comenzi durează cicluri: trei cicluri de micro-comenzi speciale ale comenzii POP și un ciclu principal Tabelul Firmware nou pentru executarea comenzii POP Comentariu de operații de microcomandă popi MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei pop Așteptați până când memoria este citită noua valoare TOS pop TOS = MDR; goto Mâini Copiați cuvântul nou în registrul TOS Mâini PC = PC + ; aduce; goto(MBR) MBR-ul conține opcode; apelează octetul următor; tranziție În tabel , secvența este redusă la trei instrucțiuni datorită faptului că ALU nu este utilizat în bucla pop Rețineți că la sfârșitul acestei secvențe, trecerea la codul următoarei instrucțiuni este imediat efectuată, deci sunt necesare doar cicluri Acest mic truc poate reduce timpul de execuție Capitolul Stratul de microarhitectură următoarea microinstrucțiune cu un ciclu, astfel încât, de exemplu, instrucțiunea IADD ulterioară este redusă de la patru cicluri la trei Acest lucru este echivalent cu creșterea frecvenței de ceas de la MHz (fiecare micro-op de ns) la MHz (fiecare micro-op de ns) Tabelul Firmware îmbunătățit pentru executarea comenzii POP Comentariu de operații de microcomandă popi MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei Mapip pop PC = PC+ ; fetch MBR-ul conține opcode; apelați octetul următor pop TOS = MDR; goto(MBR) Copiați cuvântul nou în registrul TOS; sari la codul de operare Instrucțiunea POP este foarte potrivită pentru acest rafinament deoarece conține o buclă care nu folosește o ALU, iar bucla principală necesită o ALU Astfel, pentru a reduce lungimea unei instrucțiuni cu o microinstrucțiune, este necesar să se găsească un ciclu în această instrucțiune în care ALU nu este utilizat Astfel de bucle sunt rare, dar apar, așa că este o idee bună să puneți o buclă Mâini la sfârșitul fiecărei secvențe de microinstrucțiuni Necesită doar o cantitate mică de memorie de control Deci, am aflat despre prima posibilitate de a scurta lungimea căii: Punerea unei bucle principale la sfârșitul fiecărei secvențe de microinstrucțiuni Arhitectura cu autobuze Ce altceva se poate face pentru a scurta lungimea căii? Este posibil să se alimenteze două magistrale de intrare complete, A și B, către ALU și, prin urmare, un total de trei magistrale Toate (sau cel puțin majoritatea registrelor) ar trebui să aibă acces la ambele magistrale de intrare Avantajul unui astfel de sistem este capacitatea de a adăuga orice registru la orice alt registru într-un singur ciclu Pentru a vedea cât de productivă este această abordare, luați în considerare implementarea comenzii ILOAD (Tabelul ) Tabelul Firmware pentru executarea comenzii ILOAD Comentariu de operații de microcomandă iloadl H = LV MBR conține indice; copiați LV în H iload MAR=MBRU+H; rd MAR = adresa variabilei locale care urmează să fie împinsă în stivă iload MAR = SP = SP + Registrul SP indică noul vârf al stivei; pregătirea pentru înregistrare iload PC=PC+ ; aduce; wr Mărește PC-ul cu ; apelarea următorului cod operațional; scriind partea de sus a stivei iload TOS = MDR; mergeți la actualizarea Mâini TOS Mâini PC = PC + ; aduce; goto(MBR) MBR-ul conține opcode; apelează octetul următor; tranziție Dezvoltare la nivel de microarhitectură Vedem că în microinstrucțiunea iloadl, valoarea LV este copiată în registrul H Acest lucru este necesar doar pentru a adăuga H la MBRU în microinstrucțiunea i oad Într-un design cu magistrală duală, nu este posibil să adăugați două registre arbitrare, așa că unul dintre ele trebuie mai întâi copiat în registrul H Într-o arhitectură cu magistrale, putem salva un ciclu, așa cum se arată în Tabelul Am adăugat o buclă principală la comanda ILOAD, dar lungimea căii nu a crescut sau a scăzut Cu toate acestea, magistrala suplimentară reduce timpul total de execuție a instrucțiunii de la șase cicluri la cinci Acum cunoaștem a doua modalitate de a scurta lungimea căii: Trecerea de la arhitectura cu magistrale la arhitectura cu fire Tabelul Firmware pentru executarea comenzii ILOAD în arhitectură cu autobuze Comentariu de operații de microcomandă Iload MAR = MBRU + LV; rd MAR - adresa variabilei locale care urmează să fie împinsă în stivă Iload MAR = SP = SP + Registrul SP indică noul vârf al stivei; pregătirea pentru înregistrare IloadS PC = PC + ; aduce; wr Mărește PC-ul cu ; apelarea următorului cod operațional; scriind partea de sus a stivei Iload TOS = MDR Update TOS Iload PC = PC + ; aduce; goto(MBR) MBR-ul conține deja opcode; apel de octet de index Bloc de preluare a comenzii Ambele posibilități descrise sunt destul de atractive, dar este necesar ceva mai radical pentru a obține progrese semnificative Să ne întoarcem puțin și să ne uităm la componentele obișnuite ale oricărei comenzi: câmpurile de apel și decodificare Rețineți că în fiecare comandă pot avea loc următoarele operații: + Valoarea PC este trecută prin ALU și incrementată cu ; + RS este folosit pentru a apela următorul octet din fluxul de comandă; + operanzii sunt cititi din memorie; + operanzii sunt scrieți în memorie; + ALU efectuează calculul și rezultatele sunt stocate în memorie Dacă instrucțiunea conține câmpuri suplimentare (pentru operanzi), fiecare câmp trebuie apelat în mod explicit, câte un octet Câmpul poate fi utilizat numai după ce acești octeți au fost concatenați La apelarea și asamblarea unui câmp, ALU trebuie să incrementeze PC-ul cu unul pentru fiecare octet și apoi să concateneze indexul sau offset-ul rezultat Atunci când, pe lângă realizarea lucrării principale a instrucțiunii, este necesar să apelați și să combinați câmpurile acestei instrucțiuni, ALU este utilizat în aproape fiecare ciclu Pentru a combina bucla principală cu unele microinstrucțiuni, trebuie să eliberați ALU de unele dintre aceste sarcini Pentru a face acest lucru, puteți introduce al doilea Capitolul Stratul de microarhitectură ALU, deși un ALU complet funcțional nu este necesar în majoritatea cazurilor Rețineți că ALU este adesea folosit pentru a copia o valoare dintr-un registru în altul Aceste bucle pot fi eliminate prin introducerea de căi de date suplimentare care nu trec prin ALU Ar fi util, de exemplu, să creați o cale de la TOS la MDR sau de la MDR la TOS, deoarece cuvântul de sus al stivei este adesea copiat dintr-un registru în altul În microarhitectura Mis- , cea mai mare parte a încărcăturii poate fi eliminată din ALU dacă este creat un bloc independent pentru a apela și procesa comenzi Această unitate, numită Instruction Fetch Unit (IFU), poate incrementa PC-ul cu independent de ALU și poate prelua octeți din fluxul de octeți înainte de a fi necesari IFU conține un circuit de incrementare care este mult mai simplu în design decât un adunator complet Să dezvoltăm această idee Blocul de preluare de instrucțiuni poate combina, de asemenea, operanzi pe și biți, astfel încât să poată fi utilizați de îndată ce sunt necesari Acest lucru se poate face în cel puțin două moduri: + IFU poate interpreta fiecare cod operațional, poate determina câte câmpuri suplimentare să apeleze și le poate colecta într-un registru pentru a fi utilizat de codul operațional principal ♦ IFU poate furniza în mod continuu următoarele bucăți de date de biți sau biți, indiferent dacă are sens sau nu Unitatea de operare principală poate solicita apoi orice date de care are nevoie Figura ilustrează a doua modalitate de implementare a IFU În loc de un singur MBR pe biți, există două MBR-uri aici: un MBR pe biți și un MBR pe biți IFU ține evidența celui mai recent octet sau octeți care au intrat în unitatea de operare principală În plus, transferă următorul octet către MBR, ca în arhitectura Mic- , doar în acest caz detectează automat când este citită valoarea registrului, apelează următorul octet și îl încarcă imediat în registrul MBR Ca și în microarhitectura Mis- , are două interfețe cu magistrala B: MBR și MBR U Primul primește o extensie de semn la de biți, al doilea este umplut cu zerouri Registrul MBR funcționează exact la fel, dar conține următorii octeți Are două interfețe cu magistrala B: MBR și MBR U, prima dintre acestea fiind extinsă cu semn, iar a doua este zero-padded la de biți Blocul de instrucțiuni de preluare este responsabil pentru apelarea octeților Pentru a face acest lucru, folosește portul de memorie standard de octeți, apelând cuvinte întregi de octeți înainte de timp și încărcând următorii octeți în registrul de deplasare, care îi scoate unul sau doi la un moment dat, în ordinea în care sunt preluați din memorie Sarcina registrului de deplasare este de a stoca secvența de octeți de intrare pentru încărcare în registrele MBR și MBR MBR conține întotdeauna cel mai semnificativ octet al registrului de deplasare, iar MBR - octeți înalți (cel mai mare este octetul din stânga), care formează un întreg de biți (vezi Fig , b) Cei doi octeți din MBR pot proveni din cuvinte de memorie diferite, deoarece instrucțiunile IJVM nu au nimic de-a face cu granițele cuvintelor Dezvoltare la nivel de microarhitectură Orez Blocul de preluare a comenzii în microarhitectura Mіs- Ori de câte ori este citit registrul MBR , valoarea registrului de deplasare este deplasată la dreapta cu octet Ori de câte ori este citit registrul MBR , valoarea registrului de deplasare este deplasată la dreapta cu octeți Apoi registrele MBR și MBR sunt încărcate cu octetul cel mai semnificativ și, respectiv, cu perechea de octeți cei mai semnificativi Dacă în acest moment există suficient spațiu în registrul de deplasare pentru un cuvânt întreg, unitatea de preluare a instrucțiunii începe un ciclu de acces la memorie pentru a citi cuvântul următor Presupunem că atunci când oricare dintre MBR este citit, acesta este umplut până la începutul următorului ciclu, astfel încât noua valoare poate fi citită în ciclurile următoare Blocul de preluare a instrucțiunilor poate fi modelat ca o mașină cu stări finite (FSM), așa cum se arată în Fig Orice mașină de stări este caracterizată de stări (acestea sunt cercuri în figură) și tranziții (acestea sunt arce de la o stare la alta) Fiecare stare este una dintre situațiile posibile în care se poate afla mașina de stări Această mașină de stări are șapte stări, care corespund celor șapte stări ale registrului de deplasare prezentat în Fig Aceste șapte stări corespund numărului de octeți care se află în prezent în registru (de la la inclusiv) Apelarea unui cuvânt din memorie înseamnă citirea cuvântului din memorie și introducerea a octeți în registrul de deplasare Tranziția MBR are loc când registrul MBR este citit, iar tranziția MBR are loc când registrul MBR este citit Fiecare arc reprezintă un posibil eveniment Există trei evenimente diferite posibile în mașina noastră cu stări finite Primul este de a citi un octet din registrul MBR Activează registrul de deplasare, octetul cel mai din dreapta din acesta dispare și se face o tranziție la o altă stare (mai puțin de ) Al doilea eveniment este lectura Capitolul Stratul de microarhitectură octeți din registrul MBR În acest caz, se face o tranziție la o stare mai mică decât (de exemplu, de la starea la starea sau de la starea la starea ) Ambele aceste tranziții fac ca registrele MBR și MBR să fie reîncărcate Când mașina de stări trece la stările , sau , este inițiat un apel de memorie pentru a prelua un cuvânt nou (presupunând că memoria nu mai este ocupată să citească cuvântul anterior) Când se primește un cuvânt, numărul de stare este incrementat cu Orez Mașină de stări pentru implementarea blocului de preluare a instrucțiunilor Pentru a funcționa corect, circuitul de preluare a instrucțiunilor trebuie să se blocheze dacă este necesar să efectueze o acțiune pe care nu o poate efectua (de exemplu, transmiteți o valoare la MBR când există doar octet în registrul de deplasare și memoria este încă ocupată apelând un nou cuvânt) În plus, unitatea de preluare a instrucțiunilor nu poate efectua mai multe operații în același timp, astfel încât toate informațiile primite trebuie transmise secvenţial În cele din urmă, ori de câte ori valoarea PC-ului se modifică, blocul de preluare a instrucțiunilor trebuie actualizat Toate aceste detalii complică munca blocului Cu toate acestea, multe dispozitive sunt proiectate ca mașini de stat Blocul de preluare de instrucțiuni are propriul registru de adrese de memorie, numit IMAR, care este folosit pentru a accesa memorie atunci când trebuie apelat un cuvânt nou Acest registru are o schemă de incrementare specială, astfel încât ALU principală nu trebuie să adauge la valoarea PC pentru a apela următorul cuvânt Unitatea de preluare a instrucțiunilor trebuie să monitorizeze magistrala C, astfel încât de fiecare dată când registrul PC este încărcat, noua valoare a PC-ului să fie copiată și în IMAR Deoarece noua valoare din registrul PC poate să nu fie la granița unui cuvânt, instrumentul de preluare trebuie să preia cuvântul corect și să ajusteze valoarea registrului de deplasare în consecință Unitatea de operare principală scrie valoarea pe PC numai dacă este necesar să se schimbe natura secvenței de octeți Acest lucru se întâmplă în instrucțiunea de salt, precum și în instrucțiunile INVOKEVIRTUAL și IRETURN Deoarece firmware-ul nu mai incrementează în mod explicit computerul atunci când este apelat opcode, unitatea de preluare a instrucțiunilor trebuie să actualizeze computerul însuși Cum se întâmplă asta? IFU este capabil să recunoască că a fost primit un octet din fluxul de instrucțiuni, adică că valorile registrelor MBR și MBR (sau variantele lor nesemnate) au fost deja citite O schemă de creștere separată este asociată cu registrul RS, care a crescut Dezvoltare la nivel de microarhitectură Setează valoarea la sau , în funcție de câți octeți sunt primiți Astfel, registrul PC conține întotdeauna adresa primului octet neprimit încă La începutul fiecărei instrucțiuni, registrul MBR conține adresa codului operațional al instrucțiunii Rețineți că există două scheme de increment diferite care îndeplinesc funcții diferite Registrul PC citește octeții și crește valoarea cu sau Registrul IMAR citește cuvintele și crește valoarea doar cu (pentru patru octeți noi) La fel ca MAR, registrul IMAR este conectat la magistrala de adrese, cu bitul al registrului IMAR conectat la linia de adresă , etc (declin de magistrală) pentru a trece de la o adresă de cuvânt la o adresă de octet Vom vedea în curând că, dacă nu este nevoie să creștem valoarea PC-ului în bucla principală, acesta este un mare câștig, deoarece de obicei nu se întâmplă nimic altceva în microinstrucțiunea în care are loc creșterea PC-ului Dacă această comandă este eliminată, lungimea căii va fi redusă Cu toate acestea, pentru a crește viteza mașinii, este nevoie de mai mult hardware Astfel, am ajuns la a treia posibilitate de a scurta lungimea căii: Instrucțiunile din memorie trebuie apelate de un bloc funcțional specializat Preluare comenzi din memorie - Microarhitectura Mis- Blocul de preluare a instrucțiunii poate reduce semnificativ lungimea căii pentru instrucțiunea medie În primul rând, elimină complet bucla principală, deoarece la sfârșitul fiecărei instrucțiuni, sare imediat la următoarea În al doilea rând, ALU nu trebuie să crească valoarea PC-ului În al treilea rând, IFU scurtează lungimea căii ori de câte ori se calculează un index de biți sau un offset prin concatenarea valorii de biți și trecând-o direct la ALU ca valoare de de biți fără a fi nevoie să se concateneze în registrul H orez Figura prezintă microarhitectura Mis- , care este o versiune îmbunătățită a Mis- , la care se adaugă unitatea de preluare a instrucțiunilor prezentată în Fig Firmware-ul pentru mașina îmbunătățită este prezentat în tabel Pentru a demonstra cum funcționează Mis- , luați în considerare comanda IADD Scoate al doilea cuvânt din stivă și efectuează adăugarea ca înainte, doar că acum nu mai trebuie să sară la Mâini după finalizarea operației pentru a crește valoarea PC și a trece la următoarea microinstrucțiune Când unitatea de preluare a instrucțiunilor recunoaște că MBR a fost accesat în bucla i add , registrul său intern de deplasare mută totul spre dreapta și reîncarcă MBR și MBR De asemenea, trece la o stare care este cu mai mică decât starea curentă Dacă noua stare este starea , blocul de preluare a instrucțiunii începe să reamintească cuvântul din memorie Toate acestea sunt implementate în hardware Firmware-ul nu trebuie să facă nimic De aceea, instrucțiunea IADD poate fi redusă de la cinci la trei microinstrucțiuni Capitolul Stratul de microarhitectură Către și dinspre memoria principală Semnale de control Activați semnalul către magistrala B f Scrieți semnalul de la magistrala C în înregistrare Autobuzul C Bloc de preluare a comenzii MAR MDR P RS ! MBR-*| | i MBR g' t si ISP ✓ t si LV eu f N SRR Eu TOS SRO t H Registre de gestionare a memoriei Anvelopa B Anvelopa A Control ALU ALU Orez Calea datelor pentru MIS- Tabelul Firmware pentru MIS- Micro-instrucțiune de operare Un comentariu por goto (MBR) Treceți la următoarea comandă iaddlMAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei iadd H = TOS H = partea de sus a stivei Dezvoltare la nivel de microarhitectură Comentariu de operații de microcomandă iadd MDR=TOS=MDR+H; wr; goto (MBR ) Însumarea primelor două cuvinte; scriind suma în poziția de sus a stivei isubl MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei isub H = TOS H = partea de sus a stivei isub MDR=TOS=MDR-H; wr; goto (MBR ) Scădeți TOS din valoarea numită TOS - iandl MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei iand H = TOS H = partea de sus a stivei iand MDR=TOS=MDR&H; wr; goto (MBR ) Înmulțirea booleană a valorii numite TOS - și TOS (operație AND) ior MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei ior H =TOS H = partea de sus a stivei ior MDR = TOS = MDR SAU H; wr; goto (MBR ) Adăugarea booleană a valorii numite TOS - și TOS (operație OR) dup MAR = SP = SP + Incrementați SP cu și copiați rezultatul în registrul MAR dup MDR-TOS; wr; goto (MBR ) Împingeți un cuvânt nou pe stivă popi MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei pop Programul așteaptă finalizarea procesului de citire pop TOS = MDR; goto (MBR ) Copiați cuvântul nou în registrul TOS swapl MAR = SP - ; rd Citiți al doilea cuvânt din stivă; setarea registrului MAR la SP swap MAR = SP Se pregătește pentru a scrie un nou al doilea cuvânt de stivă swap H = MDR; wr Salvați noua valoare TOS; scriind al doilea cuvânt al stivei swap MDR = TOS Copiați valoarea TOS anterioară în registrul MDR swap MAR = SP - ; wr Scrieți valoarea anterioară a TOS în a doua poziție din stivă swap TOS=H; goto (MBR ) Actualizați TOS bipushl SP = MAR = SP + Setați registrul MAR să scrie într-un nou vârf al stivei bipush MDR=TOS=MBR ; wr; goto (MBR ) Actualizați stiva în registrul și memoria TOS iload MAR = LV + MBR U; rd Mută valoarea LV cu indice în registrul MAR; citește operand Continuare & Capitolul Stratul de microarhitectură Tabelul (continuare) Comentariu de operații de microcomandă iload MAR = SP = SP + Mărește SP cu ; mutați noua valoare SP în registrul MAR iloadS TOS = MDR; wr; goto (MBR ) Actualizați stiva în registrul și memoria TOS istorel MAR = LV+MBR U Setați registrul MAR la LV -index istore MDR=TOS; wr Copiați valoarea TOS pentru a o stoca în memorie istore MAR=SP=SP- ; a rd Scăderea SP cu ; citind noua valoare TOS istore Aparatul așteaptă sfârșitul procesului de citire istore TOS - MDR; goto (MBR ) Actualizați TOS widel goto (MBR SAU x ) Următoarea adresă este x SAU opcode wide iload MAR = LV + MBR U; rd; goto iload La fel ca iloadl, dar folosind un index de octeți wide istore MAR=LV+MBR U; goto istore La fel ca istorel, dar folosind un index de octeți Idc w MAR = CPP + MBR U; rd; goto iload La fel ca wide iload , dar indexat din registrul CPP iinc MAR=LV+MBR U; rd Setați registrul MAR la valoarea LV -index; citind această valoare iinc H = MBR Atribuirea unei constante pentru registrul H ips MDR = MDR + H; wr; goto (MBR ) Creștere prin constantă și actualizare gotol H = PC - Copiați valoarea PC pentru a înregistra H goto PC = H -MBR Adăugați offset și actualizați computerul goto Aparatul așteaptă ca blocul de preluare a instrucțiunii să apeleze un nou cod operațional goto goto (MBR ) Treceți la următoarea comandă ifltl MAR=SP=SP- ; rd Citiți al doilea cuvânt din partea de sus a stivei iflt OPC = TOS Stocați temporar TOS în OPC iflt TOS = MDR Scrieți noua stivă în TOS iflt N=OPC; dacă(N) a ajuns la T; altfel mergi la F Sari pe bit N ifeql MAR=SP=SP- ; rd Citiți al doilea cuvânt din partea de sus a stivei ifeq OPC = TOS Stocați temporar TOS în OPC ifeq TOS = MDR Scrieți noua stivă de sus în TOS ifeq Z=OPC; dacă(Z) a ajuns la T; altfel mergi la F Sari pe bit Z ifjcmpeql MAR=SP=SP- ; rd Citiți al doilea cuvânt din partea de sus a stivei Dezvoltare la nivel de microarhitectură Comentariu de operații de microcomandă if icmpeq MAR = SP = SP - Setați registrul MAR pentru a citi noul vârf al stivei if icmpeq H = MDR; rd Copiați al doilea cuvânt din stivă în înregistrarea H if icmpeq OPC = TOS Stocați TOS temporar în OPC if icmpeq TOS = MDR Împingeți noua stivă de sus în TOS if icmpeq Z = H - OPC; dacă(Z) a ajuns la T; else goto F Dacă primele două cuvinte sunt egale, sari la T; dacă nu sunt egale, mergeți la F TH = PC - ; goto goto La fel ca gotol FH = MBR Ignorați octeții în MBR F merge la (MBR ) invoke virtual MAR = CPP + MBR U; rd Introduceți adresa pointerului procedurii în registrul MAR invoke virtual OPC = PC Stochează valoarea PC în registrul OPC invoke virtual PC = MDR Setați PC-ul la primul octet al codului de procedură invoke virtual TOS=SP-MBR U TOS=OBJREF adresa- invoke virtual TOS=MAR=H=TOS+ TOS=OBJREF adresa invoke virtual MDR = SP + MBR U + ; wr Suprascrieți OBJREF cu indicatorul de legătură invoke virtual MAR = SP = MDR Setați registrele SP și MAR la adresa celulei care conține vechea valoare PC invoke virtual MDR = OPC; wr Se pregătește pentru salvarea vechii valori a PC-ului invoke virtual MAR = SP = SP + Mărește SP cu ; acum SP indică celula în care este stocată vechea valoare LV invoke virtual MDR = LV; wr Salvați valoarea LV veche invoke virtual LV=TOS; goto (MBR ) Setați valoarea LV la parametrul nul ireturnl MAR=SP=LV; rd Resetează registrele SP și MAR pentru a citi indicatorul de legătură ireturn Procesul de citire a indicatorului de legătură ireturn LV=MAR=MDR; rd Setați registrele LV și MAR pentru a lega pointerul; citind vechea valoare a RS ireturn MAR = LV + Setați registrul MAR la vechea valoare a LV; citirea valorii LV vechi ireturn PC = MDR; a doua recuperare PC ireturn MAR=SP ireturn LV = MDR LV Recovery ireturn MDR=TOS; wr; goto (MBR ) Stocați rezultatul în partea de sus inițială a stivei Capitolul Stratul de microarhitectură În microarhitectura Mis- , unele comenzi sunt îmbunătățite într-o măsură mai mare decât altele Instrucțiunea LDC W este redusă de la la microinstrucțiuni și, în consecință, timpul de execuție a instrucțiunii este redus cu un factor de trei Situația este oarecum diferită cu comanda SWAP: inițial erau micro-comenzi, dar acum sunt Pentru performanța generală a computerului, reducerea comenzilor cel mai frecvent repetate joacă un rol, iar acestea sunt comenzile ILOAD (au fost , a devenit ), IADD (au fost , a devenit ) și IF ICMPEQ (a fost , a devenit pentru cazul când cuvintele sunt egale; a fost , a devenit pentru cazul când cuvintele sunt egale); nu este egal) Evaluarea comparativă a performanței sistemului poate fi utilizată pentru a calcula cât de mult s-a îmbunătățit performanța, dar chiar și fără aceasta, este clar că există un câștig semnificativ de performanță Design transportor - microarhitectura Mis- Evident, Mis- este o microarhitectură îmbunătățită a Mis- Este mai rapid și necesită mai puțină memorie de control, deși costul unității de preluare a instrucțiunilor depășește fără îndoială suma câștigată prin reducerea cantității de memorie de control Astfel, mașina Mis- funcționează mult mai rapid cu o oarecare creștere a costurilor Să vedem dacă putem crește și mai mult viteza Dar dacă încercați să reduceți timpul ciclului? În mare măsură, timpul ciclului este determinat de tehnologia de bază Cu cât tranzistoarele sunt mai mici și distanța fizică dintre ele, cu atât mai rapid poate funcționa oscilatorul principal În tehnologia pe care o luăm în considerare, timpul necesar călătoriei prin calea datelor este fix (cel puțin din punctul nostru de vedere) Cu toate acestea, avem o oarecare libertate de acțiune și, în continuare, o folosim din plin O altă opțiune de îmbunătățire este creșterea gradului de paralelism În prezent, microarhitectura Mis- realizează cele mai multe operațiuni secvenţial Pune valorile registrului pe autobuze, așteaptă ca ALU și comutatorul să le proceseze, apoi scrie rezultatele înapoi în registre Dacă nu țineți cont de funcționarea blocului de preluare a instrucțiunilor, aici nu există paralelism Introducerea unor mecanisme suplimentare pentru procesarea paralelă promite beneficii semnificative După cum sa menționat deja, timpul ciclului este determinat de timpul necesar pentru ca semnalul să treacă prin calea datelor Pe fig Figura prezintă distribuția acestei întârzieri între diferitele componente în timpul fiecărui ciclu Ciclul căii de date are trei componente principale: Timpul necesar pentru a transfera valorile registrelor selectate către magistralele A și B Timpul necesar pentru funcționarea ALU și a circuitului de schimbare Timpul necesar pentru a transfera valorile primite înapoi în registre și pentru a stoca aceste valori Dezvoltare la nivel de microarhitectură Pe fig Figura prezintă o nouă arhitectură cu magistrale cu o unitate de preluare a instrucțiunilor și trei zăvoare suplimentare (registre), fiecare situat în mijlocul fiecărei magistrale Aceste registre sunt scrise în fiecare ciclu Ele împart calea datelor în părți separate care pot funcționa independent unele de altele Vom numi o astfel de arhitectură modelul conductei, sau Mis- Orez Calea datelor cu trei autobuze în microarhitectura Mіs- Capitolul Stratul de microarhitectură De ce avem nevoie de trei registre suplimentare? La urma urmei, acum este nevoie de cicluri pentru ca semnalul să treacă prin calea datelor: unul pentru a încărca registrele A și B, al doilea pentru a porni ALU și circuitul de schimbare, precum și pentru a încărca registrul C, al treilea pentru a stoca valoarea registrului latch C înapoi în registrele necesare Suntem anormali? {Sugestie', nu ) Există două motive principale pentru introducerea de registre suplimentare: Putem crește viteza ceasului deoarece latența maximă este acum mai mică În timpul fiecărui ciclu, putem folosi toate părțile căii de date După împărțirea căii de date în trei părți, întârzierea maximă de propagare a semnalului scade, ca urmare, frecvența ceasului poate crește Vom presupune că dacă împărțim ciclul căii de date în trei intervale aproximativ egale, frecvența ceasului se va tripla (De fapt, acesta nu este cazul, deoarece am adăugat încă două registre la calea datelor, dar la o primă aproximare acest lucru este acceptabil ) Deoarece presupunem că toate citirile și scrierile din memorie în memorie sunt efectuate folosind cache-ul de prim nivel, iar acest cache este construit din același material ca și registrele, putem concluziona că o operație de memorie durează un ciclu În practică, însă, acest lucru nu este atât de ușor de realizat Al doilea punct este legat de performanța generală, și nu de viteza de execuție a unei singure comenzi În microarhitectura Mis- , în timpul primei și al treilea părți ale fiecărui ciclu, ALU este inactiv Dacă împărțiți calea datelor în trei părți, atunci devine posibil să utilizați ALU în fiecare ciclu, în urma căruia performanța mașinii este triplată Și acum să vedem cum funcționează calea de date MIS- Cu toate acestea, zăvoarele trebuie mai întâi denumite cumva Cel mai ușor este să apelați latch-urile A, B și C și să vă gândiți la ele ca niște registre, ținând cont de limitările căii de date În tabel prezintă un fragment de program pentru microarhitectura Mis- (implementarea comenzii SWAP) Tabelul Program Mis- pentru echipa SWAP Comentariu de operații de microcomandă swapl MAR = SP - ; rd Citiți al doilea cuvânt din stivă; setarea MAR pe SP swap MAR = SP Pregătirea pentru a scrie un nou al doilea cuvânt swap H = MDR; wr Salvați noua valoare TOS; împingând al doilea cuvânt pe stivă swap MDR = TOS Copiați vechea valoare TOS în registrul MDR swap MAR = SP - ; wr Împingeți vechea valoare TOS pe locul doi pe stivă swap TOS=H; goto (MBR ) Actualizați TOS Să rescriem această secvență pentru Mis- Trebuie amintit că acum calea datelor rulează trei cicluri: unul servește la încărcarea registrelor A Dezvoltare la nivel de microarhitectură și B, al doilea - pentru a efectua operația și încărcarea registrului C, al treilea - pentru a scrie rezultatele în registre Vom numi fiecare dintre aceste cicluri un micropas Implementarea comenzii SWAP pentru Міс- este prezentată în tabel În bucla , începem microinstrucțiunea swapl prin copierea valorii lui SP în registrul B Nu contează ce se întâmplă în registrul A, deoarece pentru a scădea din B, ENA (enable signal A) este blocat (vezi Tabelul ) Pentru simplitate, nu arătăm sarcini care nu sunt utilizate În bucla , efectuăm o operație de scădere În ciclul , rezultatul este stocat în registrul MAR, iar după aceea, la sfârșitul celui de-al treilea ciclu, începe procesul de citire Deoarece citirea din memorie durează un ciclu, se va încheia numai la sfârșitul celui de-al patrulea ciclu Acest lucru este afișat prin alocarea unei valori registrului MDR în ciclul Valoarea din MDR poate fi citită nu mai devreme de al cincilea ciclu Tabelul Implementarea comenzii SWAP în arhitectura Mіs- Schimbă Schimb Schimb Schimb Schimb Schimb Ciclul MAR = SP - ; rd MAR = SP H = MDR; wr MDR = TOS MAR = SP - ; wrTOS = H; du-te la (MBR ) V=SP C=B- B=SP MAR=C; rd C = B MDR = Mem MAR = C V=MDR c = B B = TOS H=C; wr C = B B = SP Mem=MDR MDR=CC=B- V=H MAR=C; wr C=B Mem - MDR TOS = C goto(MBRI) Acum înapoi la bucla Putem împărți microinstrucțiunea swap în micropași și începem să le executăm În bucla , copiem valoarea lui SP în registrul B, apoi trecem valoarea prin ALU în bucla și, în final, o stocăm în registrul MAR în bucla Până acum e bine Ar trebui să fie clar că, dacă putem începe o nouă microinstrucțiune în fiecare ciclu, viteza mașinii va crește cu un factor de trei Această creștere a vitezei se datorează faptului că mașina Mis- produce de trei ori mai multe cicluri pe secundă decât Mis- De fapt, am construit un procesor pipeline Din păcate, am lovit un blocaj în bucla Ar fi grozav să pornim microinstrucțiunea swap , dar această microinstrucțiune trece mai întâi valoarea MDR prin ALU, iar valoarea MDR nu poate fi recuperată din memorie până la începutul buclei Situația unde următorul micropas nu poate începe, deoarece înainte de asta trebuie să obțineți rezultatul micropasului anterior, se numește interdependență reală sau interdependență RAW (Read After Write - citire după scriere) Interdependențele sunt uneori denumite riscuri Capitolul Stratul de microarhitectură Într-o astfel de situație, se cere citirea valorii registrului, care încă nu a fost înscris Singura soluție rezonabilă în acest caz este amânarea pornirii microinstrucțiunii swap până când valoarea MDR devine disponibilă, adică până la al cincilea ciclu Așteptarea valorii dorite se numește inactiv După aceea, putem începe să executăm microinstrucțiuni în fiecare ciclu, deoarece astfel de situații nu mai apar, deși există o situație de frontieră: microinstrucțiunea swap citește valoarea registrului H în ciclul care urmează imediat după scrierea acestui registru în swap microinstrucțiune Dacă valoarea acestui registru ar fi citită în microinstrucțiunea swap , mașina ar trebui să rămână inactiv pentru un ciclu Deși programul Mis- necesită mai multe cicluri decât programul Mis- , este mult mai rapid Dacă timpul de ciclu al microarhitecturii Mis- este AT ns, atunci mașina Mis- are nevoie de DT ns pentru a executa comanda SWAP, iar mașina Mis- are nevoie de cicluri de HWP ns fiecare, adică un total de DT ns Pipeliningul crește viteza computerului, chiar dacă trebuie să fie inactiv o dată din cauza fenomenului de interdependență reală Pipelining-ul este o tehnologie cheie în toate procesoarele moderne, așa că este important să o înțelegem bine Pe fig Figura ilustrează grafic canalizarea căii de date prezentată în Figura Prima coloană arată ce se întâmplă în timpul ciclului , a doua coloană reprezintă ciclul și așa mai departe (presupunând că nu există timp de oprire) Zona completată din figură pentru ciclul și instrucțiunea înseamnă că blocul de preluare a instrucțiunii este ocupat cu apelarea instrucțiunii În ciclul , valorile registrelor apelate de instrucțiunea sunt încărcate în A și B, în timp ce instrucțiunea preluează blocul este ocupat apelând instrucțiunea , care este afișată și ca casete gri umplute În timpul ciclului , instrucțiunea utilizează ALU și circuitul de deplasare, registrele A și B sunt încărcate pentru instrucțiunea , este apelată instrucțiunea În cele din urmă, în timpul ciclului , toate cele instrucțiuni funcționează simultan Rezultatele instrucțiunii sunt salvate, ALU efectuează calcule pentru instrucțiunea , registrele A și B sunt încărcate pentru instrucțiunea , instrucțiunea este apelată Dacă am arăta ciclul și ulterior, modelul ar fi exact același ca în ciclul : toate cele patru părți ale căii de date ar funcționa independent una de cealaltă Această conductă conține etape: pentru apelarea comenzilor, pentru accesarea operanzilor, pentru operarea ALU și pentru scrierea rezultatului înapoi în registre Este similar cu transportorul prezentat în Fig , a, doar că îi lipsește o etapă de decodare (decriptare) Este important de subliniat aici că, deși execuția unei instrucțiuni durează cicluri, în fiecare ciclu începe o nouă instrucțiune și se încheie cea anterioară Puteți lua în considerare diagrama din fig nu pe verticală (pe coloane), ci pe orizontală (pe rânduri) Când instrucțiunea este executată în ciclul , blocul de preluare a instrucțiunii operează În ciclul , valorile registrului sunt plasate pe autobuzele A și B În ciclul funcționează ALU și schimbătorul În cele din urmă, în bucla , rezultatele sunt stocate în registre Rețineți că există dispozitive disponibile și în timpul fiecărui ciclu o anumită comandă folosește doar unul dintre ele, lăsând alte dispozitive libere pentru alte comenzi Dezvoltare la nivel de microarhitectură I Schimbați modelul I Ciclul Ciclul Ciclul Timp Orez Ilustrație grafică a funcționării transportorului Să facem o analogie cu linia de asamblare la o fabrică care produce mașini Pentru a explica esența funcționării unui astfel de transportor, imaginați-vă că un gong sună exact în fiecare minut și în acel moment toate mașinile se deplasează de-a lungul transportorului cu un pas La fiecare pas, muncitorii efectuează o operațiune specifică asupra vehiculului din fața lor, cum ar fi punerea pe roți sau frâne La fiecare lovitură a gongului (acesta este ciclu), următorul semifabricat intră în transportor și o mașină asamblată părăsește transportorul Astfel, fabrica produce o mașină pe minut, indiferent de cât timp durează asamblarea unei mașini Aceasta este esența transportorului Această abordare se aplică în mod egal procesoarelor și mașinilor Capitolul Stratul de microarhitectură Conductă în șapte etape - microarhitectură Mіs- Nu am menționat faptul că fiecare microinstrucțiune o selectează pe cea care o urmează Majoritatea dintre ei pur și simplu selectează următoarea comandă din secvența curentă, dar ultima, cum ar fi swap , face adesea o tranziție între niveluri care oprește conducta, deoarece după această tranziție nu mai este inutil să apelezi comenzi în avans Deci trebuie să venim cu o tehnologie mai bună Următoarea (și ultima) microarhitectură este Mis- Componentele sale principale sunt prezentate în Fig , dar cele mai multe dintre ele nu sunt prezentate pentru a face diagrama mai clară La fel ca Mic- , această microarhitectură conține o unitate de preluare a instrucțiunilor (IFU) care apelează cuvintele din memorie înainte de timp și stochează diferite valori MBR Orez Principalele componente ale microarhitecturii Mіs- Dezvoltare la nivel de microarhitectură Blocul de preluare a instrucțiunii transmite fluxul de octeți de intrare către o nouă componentă, blocul de decodificare Acest bloc conține un ROM intern care este indexat de codul operațional IJVM Fiecare element (rând) al blocului este format din două părți: câmpul de lungime al instrucțiunii IJVM și un index într-un alt ROM - ROM-ul micro-operațiilor Lungimea instrucțiunii IJVM este necesară pentru ca decodorul să poată împărți fluxul de octeți de intrare și să determine ce octeți sunt coduri operaționale și care octeți sunt operanzi Dacă lungimea instrucțiunii curente este de octet (de exemplu, lungimea instrucțiunii POP), atunci blocul de decodare determină că următorul octet este codul operației Dacă instrucțiunea curentă are o lungime de octeți, blocul de decodificare determină că următorul octet este un operand urmat imediat de un alt cod operațional Când apare comanda prefix WIDE, următorul octet este convertit într-un opcode extins special, de exemplu WIDE plus ILOAD devine WIDE ILOAD Blocul de decodare transmite indexul ROM micro-op pe care îl găsește în tabelul său către următoarea componentă, generatorul de cozi Acest bloc conține circuite logice și două tabele interne, unul pentru ROM și unul pentru RAM ROM-ul conține firmware-ul, iar fiecare instrucțiune IJVM constă din micro-ops Aceste micro-opțiuni trebuie să fie într-o ordine strictă și, de exemplu, trecerea de la wide iload la oad , care este permisă în microarhitectura Mic- , nu este permisă Fiecare secvență de micro-operații trebuie efectuată integral, în unele cazuri secvențele sunt duplicate Structura unui micro-op este similară cu cea a unui micro-op (vezi Figura ), doar că în acest caz, câmpurile NEXT ADDRESS și JAM lipsesc și este necesar un câmp nou pentru a defini intrarea în magistrala A Există de asemenea, doi biți noi: bitul de completare și bitul de tranziție Bitul de completare este setat pe ultimul micro-op al fiecărei secvențe (pentru a indica această operație) Este necesar un bit de salt pentru a indica micro-opțiuni, care sunt micro-sărituri condiționate Ele diferă ca format de micro-opțiunile convenționale Ele constau din biți JAM și un index în micro-op ROM Micro-instrucțiunile care obișnuiau să efectueze orice acțiuni cu calea datelor, precum și să efectueze micro-sărituri condiționate (de exemplu, flt ), acum trebuie să fie împărțite în două micro-operații Blocul de așteptare funcționează după cum urmează Acesta primește de la unitatea de decodare indexul micro-op din ROM-ul micro-op Apoi găsește micro-ul și îl copiază în coada internă După aceea, copiază următorul micro-op în aceeași coadă, precum și micro-op care urmează acestui micro-op Aceasta continuă până când apare un micro-operator cu un bit de finalizare Blocul copiază apoi acest ultim micro-operator și se oprește Dacă blocul nu a întâlnit un micro-op cu un bit de tranziție și are suficient spațiu liber rămas, acesta trimite un semnal de confirmare către blocul de decodare Când decodorul primește semnalul de confirmare, trimite următoarea comandă IJVM către coadă Astfel, secvența de instrucțiuni IJVM din memorie se transformă în cele din urmă într-o secvență de micro-opțiuni puse în coadă Aceste micro-opțiuni Capitolul Stratul de microarhitectură sunt transferate în registrele MIR, care trimit semnale către calea de date Dar mai este un factor de care trebuie să luăm în considerare: câmpurile fiecărei microoperații nu acționează simultan Câmpurile A și B sunt active în timpul primului ciclu, câmpul ALU este activ în timpul celui de-al doilea ciclu, câmpul C este activ în timpul celui de-al treilea ciclu și toate operațiunile de memorie au loc în al patrulea ciclu Pentru ca toate aceste operații să fie efectuate corect, am introdus registre MIR independente în circuitul din Fig La începutul fiecărui ciclu (în Figura , aceasta este ora Iadului), valoarea MIR este copiată în registrul MIR , valoarea MIR în registrul MIR , valoarea MIRI în registrul MIR și un nou micro-op din registrul MIR coada este încărcată în MIRI Fiecare registru MIR emite apoi semnale de control, dar doar unele dintre ele sunt folosite Câmpurile A și B din registrul MIRI sunt folosite pentru a selecta registrele care declanșează zăvoarele A și B, iar câmpul ALU din registrul MIRI nu este utilizat sau asociat cu nimic de pe calea datelor În următorul ciclu, micro-operatorul este transferat în registrul MIR ; registrele selectate sunt în zăvoarele A și B Câmpul ALU este acum folosit pentru a declanșa ALU În următorul ciclu, câmpul C va scrie rezultatele înapoi în registre Micro-op este apoi transferat în registrul MIR și inițiază orice operație de memorie necesară folosind valoarea încărcată a registrului MAR (sau MDR pentru scriere) Este necesar să discutăm încă un aspect al microarhitecturii Mis- - microtranzițiile Unele instrucțiuni IJVM necesită o ramură condiționată, care se face cu bitul N Când apare o astfel de ramură, conducta nu poate continua De aceea a trebuit să adăugăm un pic de tranziție la micro-operație Când un uop cu un astfel de bit ajunge la blocul de așteptare, blocul se abține de la a semnala primirea datelor către blocul de decodare Ca rezultat, mașina este inactivă până când această tranziție este rezolvată Probabil, unele instrucțiuni IJVM care nu depind de această tranziție ar putea fi deja transmise blocului de decodare, dar nu și blocului coadă, deoarece nu și-a semnalat încă primirea Pentru a rezolva această confuzie și a reveni la funcționarea normală, sunt necesare un dispozitiv special și mecanisme speciale, dar nu le vom lua în considerare în această carte Aici observăm doar că clasicul, care a scris despre distructivitatea comenzilor goto, a avut cu siguranță dreptate [ ] Am început cu microarhitectura Mis- și, după ce am parcurs un drum lung, am ajuns la microarhitectura Mis- Hardware-ul microarhitecturii Mis- s-a dovedit a fi foarte simplu, deoarece aproape tot controlul a fost implementat în software Microarhitectura Mis- este o structură pipeline cu șapte etape și hardware mai complex Acest transportor este prezentat în Fig Numerele din cercuri corespund componentelor din fig În microarhitectura Mis- , un flux de octeți este apelat automat din memorie în avans, decodificat în comenzi IJVM, care sunt apoi convertite într-o secvență de operații folosind ROM și aplicate conform intenției Primele trei etape ale conductei, dacă se dorește, pot fi asociate cu generatorul principal al căii de date, dar munca nu va avea loc în fiecare ciclu De exemplu, blocul de preluare a comenzii cu siguranță nu este Creșterea productivității S-ar putea să treacă un nou opcode blocului de decodare în fiecare ciclu, deoarece instrucțiunea IJVM durează mai multe cicluri pentru a se executa și coada se va umple rapid Orez Transportor Mis- În fiecare ciclu, valorile registrelor MIR sunt deplasate, iar micro-ul din capul cozii este copiat în registrul MIRI Semnalele de control de la toate cele patru MIR-uri sunt apoi trimise de-a lungul căii de date, provocând acțiuni specifice Fiecare MIR controlează o parte diferită a căii de date și, prin urmare, micropași diferiți Această dezvoltare are un procesor pipeline Acest lucru face ca pașii individuali să fie foarte scurti și frecvența ceasului ridicată Multe procesoare sunt proiectate astfel, în special cele care trebuie să execute setul de instrucțiuni legacy (CISC) De exemplu, procesorul Pentium II este similar în unele privințe cu microarhitectura Mic- , așa cum vom vedea mai târziu în acest capitol Creșterea productivității Toți producătorii de computere doresc ca sistemele lor să funcționeze cât mai repede posibil În această secțiune, vom analiza o serie de tehnologii avansate de performanță a sistemului (în primul rând CPU și memorie) care sunt în prezent cercetate Întrucât concurența în industria calculatoarelor este foarte intensă, de obicei există foarte puțin timp între apariția unei noi idei de creștere a vitezei unui computer și punerea în aplicare a acestei idei Prin urmare, majoritatea ideilor pe care le vom discuta acum sunt susceptibile de a fi aplicate în producție Îmbunătățirile luate în considerare pot fi împărțite în două categorii în ceea ce privește implementarea și arhitectura Îmbunătățirile de implementare sunt modalități de a construi un nou procesor și memorie care fac sistemul să ruleze mai rapid fără a schimba arhitectura Schimbarea implementării fără modificarea arhitecturii înseamnă că software-ul vechi va putea rula pe noua mașină, ceea ce este esențial pentru o vânzare de succes Pentru a îmbunătăți implementarea, puteți, de exemplu, să utilizați un generator master mai rapid, dar aceasta nu este singura modalitate Rețineți că creșterea performanței de la procesorul la procesoarele , Pentium, Pentium Pro și apoi Pentium II a fost realizată fără modificarea arhitecturii Cu toate acestea, unele îmbunătățiri pot fi realizate doar prin schimbarea arhitecturii Uneori, de exemplu, trebuie să adăugați comenzi noi Capitolul Stratul de microarhitectură sau registre, și în așa fel încât programele învechite să poată funcționa pe modele noi În acest caz, pentru a obține performanțe maxime, software-ul trebuie să fie reproiectat sau cel puțin recompilat pe un compilator nou Cu toate acestea, o dată la câteva decenii, dezvoltatorii realizează că vechea arhitectură nu mai este bună pentru nimic și singura modalitate de a dezvolta tehnologii în continuare este să o ia de la capăt Apariția arhitecturii RISC în anii a fost un salt atât de revoluționar, iar acum următoarea descoperire se apropie Ne vom uita la un exemplu înrudit (Intel IA- ) în Capitolul Mai târziu în această secțiune, vom acoperi patru tehnici pentru îmbunătățirea performanței procesorului Vom începe cu trei îmbunătățiri de implementare bine stabilite, apoi vom trece la una care necesită îmbunătățiri arhitecturale minore Aceste tehnici includ memoria cache, predicția ramurilor, execuția de reordonare și înlocuire a registrului și execuția speculativă Cache Una dintre cele mai importante probleme în dezvoltarea calculatoarelor a fost și rămâne organizarea unui sistem de memorie care să suporte transferul operanzilor către procesor cu aceeași viteză cu care îi prelucrează Creșterea rapidă a vitezei procesorului, din păcate, nu este însoțită de o creștere la fel de rapidă a vitezei memoriei În raport cu procesorul, memoria rulează din ce în ce mai lent Având în vedere importanța extremă a memoriei principale, această situație, care se înrăutățește în fiecare an, încetinește serios dezvoltarea sistemelor de înaltă performanță, forțând dezvoltatorii să caute soluții alternative Procesoarele moderne impun anumite cerințe sistemului de memorie atât în ceea ce privește latența (întârziere în livrarea operandului), cât și în ceea ce privește debitul (cantitatea de date transferate pe unitatea de timp) Din păcate, aceste două aspecte ale sistemului de memorie sunt în mare măsură inconsecvente De obicei, pe măsură ce lățimea de bandă crește, latența crește De exemplu, tehnologiile pipeline pe care le-am folosit în microarhitectura Mis- pot fi aplicate și sistemului de memorie, caz în care cererile de memorie vor fi procesate mai rațional, cu suprapunere Cu toate acestea, din păcate, ca și în microarhitectura Mis- , acest lucru duce la o creștere a timpului de așteptare pentru operațiunile individuale de memorie Pe măsură ce viteza oscilatorului crește, devine din ce în ce mai dificilă menținerea unui sistem de memorie care poate transfera operanzi în unul sau două cicluri O soluție la problemă este adăugarea memoriei cache După cum am observat în subsecțiunea "Cache" a secțiunii "Memorie principală" a capitolului , cuvintele cele mai des utilizate sunt stocate în memoria cache, accelerând astfel accesul la ele Dacă un procent suficient de mare din cuvintele dorite se află în cache, timpul de așteptare poate fi redus semnificativ Una dintre cele mai eficiente tehnologii pentru creșterea simultană a debitului și reducerea latenței este utilizarea Creșterea productivității mai multe blocuri cache Tehnica principală este introducerea unor cache separate pentru comenzi și date (așa-numita memorie cache partajată) Un astfel de cache are mai multe avantaje, în special, operațiunile pot începe independent în fiecare cache, ceea ce dublează debitul sistemului de memorie Din acest motiv, am avut nevoie de două porturi de memorie separate în microarhitectura Mis- : un port separat pentru fiecare cache Rețineți că fiecare cache are acces independent la memoria principală În prezent, multe sisteme de memorie sunt mult mai complexe decât acestea Cache-ul L este adesea plasat între memoria cache partajată și memoria principală În general, deoarece sunt necesare sisteme mai avansate, pot exista trei sau mai multe niveluri de cache Pe fig Figura prezintă un sistem cu trei niveluri de cache Direct pe cipul CPU este un mic cache de instrucțiuni (Ll-I) și un mic cache de date (L -D), de obicei de până la KB Există, de asemenea, o memorie cache de al doilea nivel (L ), care se află nu pe cipul procesorului în sine, ci lângă acesta în același bloc Cache-ul L este conectat la procesor printr-o cale de date de mare viteză Această memorie cache nu este de obicei divizată și combină date și instrucțiuni Dimensiunea sa este de la KB la MB Cache-ul L se află pe aceeași placă ca și procesorul și constă de obicei din câțiva megaocteți de RAM statică, care este mult mai rapidă decât memoria principală DRAM De obicei, tot conținutul cache-ului L se află în cache-ul L , iar tot cache-ul L se află în cache-ul L Orez Sistem cu trei niveluri de cache Capitolul Stratul de microarhitectură Există două opțiuni pentru localizarea adresei, de care depinde funcționarea memoriei cache Localizarea spațială se bazează pe probabilitatea ca în viitorul apropiat să fie nevoie de acces la celulele de memorie situate lângă celulele numite recent Pe baza acestei observații, în cache sunt transferate mai multe date decât este necesar în prezent Localizarea temporală are loc atunci când celulele apelate recent sunt solicitate din nou Acest lucru se poate întâmpla, de exemplu, cu celulele de memorie din partea de sus a stivei sau cu instrucțiuni în interiorul unei bucle Principiul localizării temporale este folosit pentru a selecta elementele care ar trebui eliminate din cache în cazul unei pierderi de cache De obicei, acele elemente care nu au fost accesate de mult timp sunt șterse Toate tipurile de cache folosesc următorul model Memoria principală este împărțită în blocuri de dimensiuni fixe numite linii cache O linie de cache constă din mai mulți octeți consecutivi (de obicei, până la de octeți) Liniile sunt numerotate începând de la , adică dacă dimensiunea liniei este de de octeți, atunci linia este de octeți de la la , linia este de octeți de la la etc În orice moment în cache-ul conține mai multe linii Când are loc un acces la memorie, controlerul cache verifică dacă cuvântul dorit este în cache Dacă cuvântul este prezent (cazul unei lovituri în cache), atunci timpul necesar pentru a accesa memoria principală poate fi salvat Dacă cuvântul dat nu se află în cache (cazul unei pierderi de cache), atunci una dintre liniile din cache este ștearsă, iar linia solicitată din memoria principală sau din memoria cache a unui nivel inferior este plasată acolo Există multe variante ale acestei scheme, dar ele se bazează întotdeauna pe ideea de a păstra cât mai multe linii utilizate frecvent în cache, astfel încât numărul de accesări în cache să fie maximizat Cache mapat direct Cel mai simplu tip de cache este un cache mapat direct Un exemplu de cache cu mapare directă pe un singur nivel este prezentat în Fig , a Acest cache conține de intrări Fiecare element (rând) poate deține exact un termen din memoria principală Dacă dimensiunea liniei cache-ului este de de octeți (ca în acest exemplu), memoria cache poate conține KB Fiecare element cache este format din trei părți: + Bitul de validitate indică dacă există sau nu date valide în element Când sistemul pornește, toate elementele sunt marcate ca nevalide + Câmpul de etichetă constă dintr-o valoare unică de biți care indică linia corespunzătoare de memorie din care provin datele + Câmpul de date conține o copie a datelor de memorie Acest câmp conține o linie cache de de octeți În memoria cache mapată direct, un anumit cuvânt poate fi stocat doar într-un singur loc Dacă nu este în acest loc, atunci nu este deloc în cache Pentru a stoca date în cache și a le prelua din cache, adresa este împărțită în componente, așa cum se arată în Fig b + Câmpul șir indică ce intrare în cache conține datele corespunzătoare, dacă există Creșterea productivității Pic Biți Tag String Word Byte b Orez Cache de cartografiere directă (a); Adresă virtuală pe de biți (b) + Câmpul de etichetă corespunde biților stocați în câmpul de etichetă al intrării în cache + Câmpul cuvânt indică ce cuvânt din șir este referit + Câmpul octet nu este utilizat în mod normal, dar dacă este necesar doar un octet, acest câmp indică exact ce octet din cuvânt este necesar Pentru cache-urile care acceptă numai cuvinte pe de biți, acest câmp este întotdeauna Când CPU emite o adresă de memorie, hardware-ul extrage cei biți ai câmpului șir din acea adresă și îi folosește pentru a căuta una dintre cele de intrări din cache Dacă elementul este valid, atunci se face o comparație între câmpul etichetei de memorie principală și câmpul etichetei cache Dacă câmpurile sunt egale, atunci memoria cache conține cuvântul solicitat Această situație se numește hit cache În cazul unei lovituri în cache, cuvântul este preluat direct din cache, iar apoi nu este nevoie să accesați memoria principală Din elementul cache este luat doar cuvântul dorit, restul elementului nu este folosit Dacă elementul cache este invalid (invalid) sau câmpurile de etichetă nu se potrivesc, atunci cuvântul dorit nu este în memorie Această situație se numește cache miss În acest caz, șirul de de octeți este preluat din memoria principală și stocat în cache, înlocuind orice element a fost acolo Cu toate acestea, dacă o intrare existentă în cache este modificată, aceasta trebuie scrisă înapoi în memoria principală înainte de a fi eliminată În ciuda complexității soluției, accesul la cuvântul dorit poate fi extrem de rapid Deoarece adresa este cunoscută, se cunoaște și locația exactă Capitolul Stratul de microarhitectură cuvânt, dacă există în cache Aceasta înseamnă că trebuie să citiți cuvântul din cache, să îl livrați procesorului și, în același timp, să verificați dacă acest cuvânt este corect (comparând câmpurile etichetei) Prin urmare, procesorul primește de fapt cuvântul din cache în același timp sau chiar înainte de a ști dacă cuvântul solicitat este sau nu Cu această schemă, liniile contigue ale memoriei principale sunt plasate în intrările în cache adiacente De fapt, în cache pot fi stocate până la KB de date contigue Cu toate acestea, două șiruri de caractere ale căror adrese diferă cu exact KB ( octeți) sau cu orice multiplu al acelui număr nu pot fi stocate în cache în același timp (deoarece au aceeași valoare a câmpului șirului) De exemplu, dacă un program accesează date la adresa X și apoi execută o instrucțiune care necesită date la adresa X + (sau orice altă adresă de pe aceeași linie), a doua instrucțiune necesită reîncărcarea unei intrări în cache Dacă acest lucru se întâmplă destul de des, pot apărea probleme De fapt, dacă memoria cache nu funcționează bine, este mai bine să nu o aveți deloc, deoarece fiecare operație de pe memoria principală citește o linie întreagă, nu un singur cuvânt Cache-urile cu mapare directă sunt cel mai comun tip de cache și sunt destul de eficiente, deoarece coliziunile ca aceasta au loc rar sau niciodată De exemplu, un compilator bun poate lua în considerare astfel de coliziuni atunci când plasează instrucțiuni și date în memorie Rețineți că acest caz nu va apărea pe un sistem în care comenzile și datele sunt stocate separat, deoarece solicitările conflictuale vor fi servite de cache-uri diferite Astfel, vedem al doilea avantaj de a avea două cache-uri în loc de unul - mai multă flexibilitate în rezolvarea situațiilor de conflict Memoria cache asociativă cu acces multiplu După cum sa menționat mai devreme, diferite linii de memorie principală concurează pentru dreptul de a ocupa aceeași zonă de cache Dacă programul folosește memoria cache prezentată în fig Așa cum se arată în Figura a, cuvintele la adresele și sunt adesea necesare, vor exista conflicte constante, deoarece fiecare acces poate determina evacuarea unei linii din cache Pentru a rezolva această problemă, trebuie să vă asigurați că fiecare element cache se potrivește cu două sau mai multe linii Un cache cu n intrări posibile pentru fiecare adresă este numit cache asociativ cu n căi Cache-ul asociativ cu căi este prezentat în fig Un cache asociativ cu acces multiplu este în mod inerent mult mai complex decât un cache mapat direct, deoarece, deși o intrare în cache poate fi calculată de la o adresă de memorie principală, n intrări în cache trebuie verificate pentru a vedea dacă memoria cache pe care o dorim este acolo cu toate acestea De fapt, astfel de ciocniri nu sunt atât de rare datorită faptului că, cu metoda de paginare de organizare a memoriei virtuale și execuția paralelă a mai multor sarcini, paginile par a fi "mixte" Paginarea programului se realizează aleatoriu, astfel încât "localitatea codului" poate fi încălcată - Notă științific ed Creșterea productivității practica arată că memoria cache asociativă cu sau căi dă un rezultat bun, deci introducerea acestor scheme suplimentare este destul de justificată Bit Bit Bit Bit credibilitate credibilitate credibilitate credibilitate Tag Data I Tag Data i Tag Data I Tag Data - ? - £ i g i g Element A Element B Element C Element D Orez Cache asociativ cu căi Utilizarea unui cache asociativ cu acces multiplu oferă dezvoltatorului o alegere Dacă un element nou trebuie plasat în cache, care dintre elementele vechi ar trebui eliminat? Pentru majoritatea sarcinilor, algoritmul de procesare a elementului care nu a fost folosit cel mai mult timp (Least Recenly Used, LRU) este bine potrivit Există o ordine specifică pentru fiecare set de celule disponibile dintr-o locație de memorie dată Ori de câte ori este accesat orice rând, conform algoritmului LRU, lista este actualizată și este marcat elementul care a fost accesat ultima dată Când este necesară înlocuirea oricărui element, se șterge cel de la sfârșitul listei, adică cel care a fost folosit înaintea celorlalți Este posibil și un caz extrem - un cache asociativ cu de moduri care conține un singur set de elemente În acest caz, toate adresele de memorie ajung în acest set, așa că atunci când căutați, trebuie să comparați adresa dorită cu toate cele de etichete din cache Rețineți că pentru aceasta, fiecare element cache trebuie să conțină un circuit logic special Deoarece câmpul șir este nul în acest caz, câmpul etichetă este întreaga adresă, cu excepția câmpurilor cuvânt și octet Mai mult, atunci când o linie de cache este înlocuită, toate cele de elemente sunt posibile candidați pentru înlocuire Stocarea unei liste ordonate ar necesita o contabilizare greoaie a utilizării resurselor sistemului, astfel încât algoritmul LRU nu este posibil (Reamintim că lista trebuie actualizată cu fiecare operațiune de memorie ) Interesant, un cache cu un număr mare de intrări nu funcționează întotdeauna mai bine decât un cache cu un număr mic de intrări și, în unele cazuri, funcționează chiar mai rău Prin urmare, numărul de intrări mai mare de patru este rar Capitolul Stratul de microarhitectură În cele din urmă, scrierile sunt o problemă specială pentru memoria cache Când procesorul scrie un cuvânt și cuvântul se află în cache, trebuie evident fie să actualizeze cuvântul, fie să ștergă intrarea în cache În aproape toate evoluțiile, are loc o actualizare a memoriei cache Dar cum rămâne cu actualizarea copiei din memoria principală? Această operațiune poate fi amânată până mai târziu până când linia cache este gata să fie înlocuită în conformitate cu algoritmul LRU Alegerea este dificilă și nici una dintre soluții nu este preferată Actualizarea imediată a elementului de memorie principal se numește write-through Această abordare este de obicei mult mai ușor de implementat și, de asemenea, mai fiabilă, deoarece memoria modernă își poate restabili întotdeauna starea anterioară în cazul unei erori Din păcate, acest lucru necesită transferarea mai multor date în memorie, așa că în proiectele complexe, aceștia tind să folosească o abordare alternativă - writeback sau scriere întârziată Există o altă problemă cu procesul de scriere: ce se întâmplă dacă trebuie să scrieți ceva într-o locație care nu este în cache? Ar trebui ca datele să fie trimise în cache sau doar scrise în memoria principală? Din nou, niciunul dintre răspunsuri nu este cel mai bun din toate punctele de vedere În majoritatea modelelor care utilizează writeback, datele sunt transferate în cache Această tehnică se numește alocare de scriere Pe de altă parte, modelele de tip write-through tind să nu memoreze în cache elementul atunci când este scris, deoarece acest lucru adaugă complexitate sistemului Completarea prin introducere este utilă numai dacă există scrieri repetate la același cuvânt sau la cuvinte diferite în aceeași linie de cache Eficiența stocării în cache este esențială pentru îmbunătățirea performanței generale a sistemului datorită decalajului imens dintre performanța procesorului și a memoriei Discuția despre strategiile alternative de stocare în cache este în desfășurare [ , , , , ] Predicția ramurilor Calculatoarele moderne sunt în mare parte conectate Transportorul prezentat în fig are șapte trepte; calculatoarele mai complexe conțin conducte cu zece sau mai multe etape Pipeliningul funcționează cel mai bine cu codul liniar, astfel încât instrumentul de preluare a instrucțiunilor poate citi pur și simplu cuvintele succesive din memorie și le trimite la decodor înainte de timp, înainte de a fi necesare Singura problemă este că acest model este complet nerealist Programele nu sunt coduri liniare deloc Sunt pline de comenzi de sărituri Luați în considerare comenzile simple din Listarea Variabila i este comparată cu (probabil cea mai comună comparație în practică) În funcție de rezultat, celeilalte variabile, k, i se atribuie una dintre cele două valori posibile Lista Fragment de program dacă(i== ) k= ; el se k= ; Creșterea productivității O posibilă traducere în limbaj de asamblare este prezentată în Lista Limbajul de asamblare va fi discutat mai târziu în această carte, dar deocamdată este suficient să știm că un program mai mult sau mai puțin ca Listing este destul de posibil Prima comandă compară variabila i cu zero A doua comandă sare la clauza Else dacă i nu este egal cu A treia comandă atribuie variabilei k valoarea A patra comandă sare la următoarea instrucțiune de program Compilatorul a pus eticheta Next acolo A cincea comandă atribuie valoarea variabilei k Lista Listarea după traducerea în limbaj de asamblare SMR o BNE Altceva Apoi: MOV k BR În continuare Altfel: MOV k, Următorul: comparație c trecerea la Else dacă nu sunt egale, atribuiți valoarea variabilei k săriți necondiționat la Următorul atribuiți valoarea variabilei k Vedem că două dintre cele cinci comenzi sunt comenzi de tranziție Mai mult decât atât, una dintre ele, BNE, este o instrucțiune de ramură condiționată (o ramură care apare dacă și numai dacă este îndeplinită o anumită condiție, în acest caz este egalitatea celor doi operanzi ai instrucțiunii CMP anterioare) Cel mai lung cod de linie de aici este format din două instrucțiuni, așa că este foarte dificil să organizați o conductă de mare viteză La prima vedere, salturile necondiționate, cum ar fi comanda BR Next din Listarea , ar putea să nu pară o problemă În general vorbind, în acest caz nu există nicio ambiguitate cu privire la unde să mergem în continuare De ce nu poate continua să citească instrucțiunile de la adresa țintă (adică de unde se face saltul)? Complexitatea se datorează însăși naturii conductei Pe fig , de exemplu, vedem că decodarea are loc în a doua etapă Prin urmare, aducătorul de instrucțiuni trebuie să decidă de unde să apeleze următoarea instrucțiune înainte de a ști chiar ce tip de instrucțiune tocmai a numit-o Abia în ciclul următor, va putea afla că a primit o comandă de ramificare necondiționată, deși și înainte de aceasta apelează comanda urmând comanda de ramificare necondiționată Adică, într-o mare parte a mașinilor pipeline (de exemplu, UltraSPARC III), instrucțiunea care urmează instrucțiunii de salt necondiționat este executată prima, deși logic nu ar trebui să fie așa Poziția de după salt se numește slot de întârziere Pentium II (precum și mașina folosită în listarea - ) nu acceptă un slot de backoff și este adesea dificil să ocoliți această problemă din cauza complexității interne Compilatorul de optimizare va încerca să găsească o instrucțiune utilă de pus în slotul de amânare, dar adesea nu este nimic potrivit, așa că compilatorul este forțat să insereze o instrucțiune NOP acolo Deși programul rămâne corect, crește în dimensiune și rulează mai lent Salturile condiționate sunt și mai rele În primul rând, conțin și sloturi de amânare, iar în al doilea rând, unitatea de preluare a comenzii învață de unde să citească comanda mult mai târziu Primele mașini cu conducte au rămas pur și simplu inactiv în timp ce sa decis dacă să facă sau nu o tranziție Inactiv trei sau patru cicluri pe fiecare ramură condiționată, mai ales dacă % Capitolul Stratul de microarhitectură instrucțiunile sunt instrucțiuni de ramificare condiționată, reduce semnificativ performanța Prin urmare, majoritatea mașinilor prezic dacă saltul condiționat pe care îl întâlnesc va fi făcut sau nu Pentru a face acest lucru, de exemplu, putem presupune că toate săriturile condiționate înapoi vor fi executate, dar nu toate săriturile condiționate înainte În ceea ce privește prima parte a ipotezei, instrucțiunile de salt înapoi sunt de obicei plasate la sfârșitul buclelor și majoritatea buclelor sunt executate de mai multe ori, astfel încât săritul la începutul buclei va fi cel mai adesea corect A doua parte a ipotezei este mai complicată Unele salturi înainte apar atunci când este detectată o eroare în program (de exemplu, un fișier nu poate fi deschis) Greșelile sunt rare, așa că majoritatea tranzițiilor nu au loc Desigur, există multe sărituri înainte care nu au nicio legătură cu erorile, așa că rata de succes aici nu este la fel de mare ca în cazul unui salt înapoi Cu toate acestea, este încă mai bine decât nimic Dacă tranziția este prezisă corect, atunci nu trebuie făcut nimic special Pur și simplu programul continuă să ruleze Problema apare atunci când tranziția nu este prezisă corect Este ușor să-ți dai seama unde trebuie să mergi și să mergi acolo Cel mai dificil lucru este să anulați comenzile care au fost deja executate și care nu ar fi trebuit să fie executate Există două moduri de a anula comenzile Prima modalitate este să continuați să executați instrucțiunile apelate după saltul condiționat prezis până când una dintre acele instrucțiuni încearcă să schimbe starea mașinii (de exemplu, stocarea unei valori într-un registru) Apoi, în loc să suprascrieți registrul, trebuie să puneți valoarea calculată într-un registru temporar (ascuns) și apoi, când se dovedește că predicția a fost corectă, doar copiați această valoare într-un registru obișnuit A doua modalitate este de a stoca (de exemplu, într-un registru temporar ascuns) valoarea oricărui registru care poate fi suprascris Ca rezultat, mașina va putea reveni la starea anterioară în cazul unei tranziții incorect prezise Implementarea ambelor abordări este foarte complexă și necesită un sistem de contabilitate greoi pentru utilizarea resurselor sistemului Și dacă o a doua ramură condiționată este întâlnită înainte de a se ști dacă prima ramură condiționată a fost corect prezisă, situația poate deveni complet confuză Predicția dinamică a ramurilor În mod clar, predicțiile precise sunt foarte valoroase, deoarece permit procesorului să ruleze la viteză maximă În prezent, se desfășoară multe studii, al căror scop este îmbunătățirea algoritmilor de predicție a ramurilor [ , , , ] O abordare este de a stoca (într-un dispozitiv special) un tabel special în care CPU va scrie ramuri condiționate atunci când apar Dacă ramura condiționată apare din nou, aceasta poate fi găsită în acest tabel Cea mai simplă versiune a unui astfel de circuit este prezentată în Fig , a În acest caz, tabelul conține o celulă pentru fiecare instrucțiune de salt condiționat Celula conține adresa comenzii de salt Creșterea productivității da, precum și un bit care indică dacă ramura a apărut când această comandă a fost întâlnită ultima dată Predicția constă în alegerea aceleiași căi pe care programul a luat-o în timp anterior la executarea comenzii de salt Dacă predicția se dovedește a fi greșită, bitul din tabel se schimbă Pic Pic Pic Orez Tabelul dinamicii de ramificare cu un indicator de salt cu o singură cifră (a); tabel de dinamică de ramificare cu indicator de salt pe biți (b); corespondența dintre adresa instrucțiunii de salt și adresa țintă (c) Există mai multe opțiuni pentru organizarea acestei mese De fapt, sunt complet similare cu opțiunile de organizare a memoriei cache Luați în considerare o mașină cu instrucțiuni pe de biți aranjate astfel încât cei doi biți cei mai puțin semnificativi ai fiecărei adrese de memorie să fie Tabelul conține n celule (rânduri) Puteți extrage cei n + biți cei mai puțin semnificativi din instrucțiunea de salt și puteți muta la dreapta cu doi biți Acest număr de n biți poate fi folosit ca index într-un tabel, verificând dacă adresa stocată acolo se potrivește cu adresa de salt Ca și în cazul memoriei cache, nu este nevoie să stocați cei n + biți low, astfel încât aceștia pot fi omiși (adică sunt salvați doar biții de adresă înaltă - eticheta) Dacă adresele se potrivesc, bitul de predicție este utilizat pentru a prezice ramura Dacă eticheta este invalidă sau elementul este invalid Capitolul Stratul de microarhitectură este telen, ceea ce înseamnă că există o ratare În acest caz, se poate aplica regula înainte/înapoi Dacă tabelul de dinamică de salt conține, să zicem, de intrări, atunci adresele , , etc vor intra în conflict; o problemă similară apare atunci când lucrați cu memoria cache Aici este posibilă aceeași soluție: element asociativ -alternativ, -alternativ sau n-alternativ Ca și în cazul memoriei cache, cazul limită este un element asociativ ^-alternativ Cu o dimensiune a tabelului suficient de mare și un grad suficient de asociativitate, această schemă este potrivită pentru majoritatea situațiilor Cu toate acestea, trebuie să înfrunți problema în mod sistematic Când bucla iese, ramura este prezisă incorect și, mai rău, această predicție greșită se schimbă puțin în tabel, ceea ce va indica apoi că ramura nu este necesară Adică, data viitoare când bucla trebuie să fie executată din nou, saltul de la sfârșitul primei treceri a buclei va fi estimat greșit Dacă bucla se află în interiorul unei alte bucle sau într-o procedură numită frecvent, această eroare se va repeta destul de des Pentru a rezolva problema, puteți schimba ușor metoda de prognoză, astfel încât prognoza să se schimbe nu după una, ci numai după două prognoze incorecte succesive Această abordare necesită doi biți de predicție de ramificație în tabel (Fig b): unul ar trebui să indice dacă tranziția ar trebui să aibă loc sau nu, iar al doilea dacă tranziția a fost făcută ultima dată sau nu Acest algoritm poate fi reprezentat ca o mașină cu stări finite cu patru stări (Figura ) După o serie de predicții succesive fără tranziție, mașina de stări va fi în starea și data viitoare va indica, de asemenea, că nu există nicio tranziție Fără tranziție Orez Mașină de stări pe biți pentru predicția ramurilor Dacă această predicție se dovedește a fi greșită, automatul va trece în starea , dar data viitoare nu va afișa în continuare nicio tranziție Numai în asta Creșterea productivității Dacă și această ultimă predicție este greșită, mașina de stări va trece în starea AND, prezicând prezența tranziției De fapt, bitul din stânga este predicția, iar bitul din dreapta este ceea ce sa întâmplat data trecută (adică dacă a existat o tranziție) În acest design, sunt utilizați doar biți, dar sunt posibili atât , cât și biți Aceasta nu este prima mașină de stat pe care o luăm în considerare Pe fig arată și o mașină de stări De fapt, toate microprogramele noastre pot fi considerate mașini de stări, deoarece fiecare linie reprezintă o stare specială în care se poate afla mașina, cu tranziții bine definite la un set finit de alte stări Mașinile de stat sunt foarte utilizate pe scară largă în dezvoltarea hardware-ului Până acum, am presupus că ținta fiecărui salt condiționat este cunoscută De obicei, fie adresa la care sări era dată în mod explicit (aceasta era conținută direct în instrucțiune), fie se cunoștea decalajul relativ la instrucțiunea curentă (adică un număr cu semn care trebuia adăugat la contorul programului) Adesea, această presupunere este validă, dar unele instrucțiuni de sărituri condiționate calculează adresa țintă efectuând mai întâi anumite operații aritmetice asupra valorilor registrului Chiar dacă luăm mașina de stări prezentată în Fig , care prezice cu exactitate tranzițiile, predicția va fi nerevendicată deoarece adresa țintă este necunoscută O posibilă cale de ieșire din această situație este stocarea în tabel a adresei la care a fost efectuată ultima dată tranziția, așa cum se arată în Fig , , c Apoi, dacă tabelul indică faptul că ultima dată când a fost întâlnită instrucțiunea de salt la adresa , saltul a fost făcut la adresa , ținta va fi din nou adresa (în cazul în care este prezis un salt) O altă abordare a predicției ramurilor este de a urmări dacă ultimele k ramuri condiționate au fost luate, indiferent de instrucțiunile acestea Acest număr de ^-bit, care este stocat în registrul de deplasare a dinamicii tranziției, este apoi comparat în paralel cu toate elementele tabelului cu o cheie de ^-bit, iar în cazul unei potriviri, se aplică predicția găsită în acest element În mod surprinzător, această tehnologie funcționează destul de bine Predicția ramurilor statice Toate tehnicile de predicție a ramurilor discutate până acum sunt dinamice, adică rulează în timp ce programul rulează Se adaptează la modul actual de funcționare al programului, iar aceasta este calitatea lor pozitivă Dezavantajul acestor tehnologii este că necesită hardware specializat și costisitor, iar cipurile pentru implementarea acestor tehnologii sunt foarte complexe Puteți merge în altă direcție apelând compilatorul pentru ajutor Observați următoarea afirmație: pentru (I = ; < ; ++) { } Când compilatorul întâlnește o astfel de declarație, știe că ramura de la sfârșitul buclei va apărea aproape întotdeauna Dacă ar exista o modalitate de a comunica acest lucru hardware-ului, ar putea fi salvată o cantitate imensă de muncă Capitolul Stratul de microarhitectură Deși această abordare implică o schimbare a arhitecturii (nu doar implementarea), unele mașini, cum ar fi UltraSPARC III, au un alt set de instrucțiuni în plus față de instrucțiunile obișnuite de ramificare condiționată (care sunt necesare pentru compatibilitatea cu înapoi) Noile instrucțiuni conțin un bit prin care compilatorul stabilește dacă se ramifică sau nu Când se întâlnește un astfel de bit, blocul de preluare a instrucțiunii face pur și simplu ceea ce ar trebui să facă Mai mult, nu este nevoie să risipești spațiu prețios în tabelul de dinamică de tranziție pentru aceste comenzi, ceea ce reduce numărul de situații conflictuale În cele din urmă, cea mai recentă tehnologie de predicție a ramurilor se bazează pe profilare [ ] Aceasta este, de asemenea, o tehnică statică, doar că în acest caz programul nu obligă compilatorul să calculeze ce salturi trebuie făcute și care nu Programul este de fapt executat, iar ramurile sunt comise, aceste informații sunt transmise compilatorului, care apoi folosește instrucțiuni speciale de salt condiționat pentru a spune hardware-ului ce trebuie să facă Executarea cu schimbare de succesiune și înlocuire de registre Cele mai multe procesoare moderne sunt atât pipeline, cât și superscalare, așa cum se arată în Fig Aceasta înseamnă că există o unitate de preluare a instrucțiunilor (IFU) care apelează instrucțiuni din memorie înainte de timp și 